每日頭條!CVPR再度上演抄襲大戲：IBM中稿論文被指照搬自己承辦競賽第二名的idea

來源：36kr時間：2022-06-28 14:36:44

一波未平，一波又起，CVPR 2022又被曝出論文抄襲！

這兩天，來自中國的研究團隊發現，自己去年參加ICDAR競賽的idea，竟然被IBM拿去投中了今年的CVPR。

而這件事最諷刺的一點在于，ICDAR 2021正是由IBM自己承辦的。

(資料圖)

目前，作者已經將相關舉證信息發給了CVPR的Program Chairs。

這件事的熱度還在發酵。Reddit上的討論熱度即將破千。

然而，挑戰大廠的權威，又何談容易呢。

作者自述

下面，讓我們用第一人稱，還原一下原作者的自述。感受一下原作者的憤怒和委屈。

「我叫Xianbiao Qi，在計算機視覺領域搞研究已經十多年了。我寫這篇博客是為了揭露一起明目張膽的剽竊行為。IBM蘇黎世研究院剽竊了我們的研究。」

「他們抄的不是文本內容，他們抄的是我們辛辛苦苦做出來的idea。」

Xianbiao Qi所說的論文是「PingAn-VCGroup"s Solution for ICDAR 2021 Competition on Scientific Literature Parsing Task B: Table Recognition to HTML」，于2021年6月上傳至arXiv，合作者有Jiaquan Ye, Xianbiao Qi和Yelin He等人。

此外，代碼也一并進行了開源。

論文地址：https://arxiv.org/abs/2105.01848

而抄襲團隊則是來自IBM蘇黎世研究院的Ahmed Nassar, Nikolaos Livathinos, Maksym Lysak和Peter Staar等人。

他們把最精華的點子吃干抹凈帶走，然后把文章改頭換面地發在了IEEE/CVF計算機視覺和模式識別會議論文集上。

剽過來的文章名叫「TableFormer: Table Structure Understanding with Transformers」，請大家擦亮慧眼。

論文地址：https://arxiv.org/abs/2203.01017

Xianbiao Qi表示，Nassar等人的文章把我們的整體方法，以及預處理和后期處理的部分、可視化部分、推理部分、給出的系統解決方案都抄了過去。甚至還有代碼和預訓練模型。

但是，Nassar等人沒什么別的本事，完美包裝卻熟練得很。他們的文章沒有一個字引用了Xianbiao Qi團隊的文章內容。他們以為這樣就能把查重蒙騙過去了。

通俗地講就是，研究生抄襲一般直接抄文字，而這位蘇黎世的博士后更「高級」——重寫idea。

實際上，這辦法還真行。Nassar等人的文章確實沒被判定為抄襲。最后還是其他很多專家發現了兩篇文章在idea上的雷同，轉告給了Xianbiao Qi團隊。

在Reddit上，有不少網友表示支持作者維權，同時也提醒他在舉證的時候盡量不要帶有情緒，雖然很難做到。

也有網友指出，現在列出的證據遠非決定性的：

這兩個團隊在同一個問題上，使用相同的公開數據，解決方案也有相似之處。但這并不意味著一方抄襲了另一方。

而知乎上對此的討論也非常熱烈。

簡要時間線

事情就是這么個事情，時間線還是有必要好好梳理一下的：

2021年4月7日，Xianbiao Qi團隊結束了ICDAR 2021表格識別競賽，并取得了第二名的成績。這是由澳大利亞的IBM小組舉辦的。

同年5月5日，團隊在arXiv上發表了想法的技術報告，以及預印版本。占了個坑。

兩個月之后的7月29日，團隊開源了相關代碼，甚至還在Github上公開了相關的幻燈片。

2021年9月，團隊發布了TableMASTER的預訓練模型。11月，繼續發布了tablemaster_mmocr的docker環境。

Xianbiao Qi自嘲道，「我們這個項目基本等于全裸了，該發布的全發布了。但我們發布是為了造福整個社區，不是方便你們抄襲來的。」

年底，來也技術團隊在「表格識別方法評述及來也科技的實踐」提到了這篇論文：

TableMASTER從一個非常新穎的角度來解決表格識別問題，是一次大膽的嘗試，并且效果也是十分出色。PaddleOCR也用相似的思路開源了一個十分輕量的表格識別模型，并提供了PubTabNet數據集的預訓練模型，略有不同的是paddleTable采用了RARE和GRU而不是MASTER和transformer。

時間來到2022年3月2日，TableFormer發布了。

當然，Xianbiao Qi憤怒之下沒有喪失冷靜，他列舉了九大證據，實錘抄襲。