(IvyP/譯)兩名計較機生物學家在操縱PubMed搜刮引擎領會最新研究動態時,偶爾發覺中國的論文銷售公司仍然在運作,而在1年前,《科學》(Science)期刊就曾經頒發過一篇文章,深切闡發了這一布局復雜又利潤豐厚的財產。
巴塞羅那基因組調控核心的吉拉姆·菲利翁(Guillaume Filion)和法布拉大學的盧卡斯·凱瑞(Lucas Carey)從PubMed下載了2012年1月到本年4月期間的論文出書記實。通過操縱一種稱為天然言語處置(natural language processing,NLP)的手藝,二人將這200萬篇論文的摘要部門進行比對闡發,找出了2014年呈現頻次最高的詞匯。
菲利翁暗示,他們本來是但愿通過這種方式找到會成為熱點的新研究標的目的。不出所料,他們發覺與前沿話題相關的研究論文的數量有所添加,例如CRISPR(clustered regularly interspaced short palindromic repeats,紀律成簇的間隔短回文反復),一種被《科學》(Science)期刊提名為2013年最主要科學沖破第二名的基因編纂手藝;以及目前基因組學研究中的搶手——長鏈非編碼RNA(long non-coding RNA,lncRNA)。
但除了這些預料之中的研究趨向,還有一個很凸起的詞匯——由位于倫敦的彌補醫學研究委員會(Research Council for Complementary Medicine)運作的一個不為人知的數據庫CISCOM。菲利翁和凱瑞指出,2014年之前,“CISCOM”這個字眼每年僅會出此刻2-3篇論文中,而從2014年2月起,這個數據庫俄然間起頭每個禮拜就呈現一次。
二人通過進一步闡發發覺,一組32篇相關分歧主題的論文卻都有著不異的特征——都是操縱數據庫里已頒發得文章寫出的綜述文章,這些數據庫不單包羅CISCOM,還包羅一些較常用的數據庫,如谷歌學術搜刮、PubMed和Web of Science等。此外,這些文章全數來自分布于中國若干城市的28個分歧的研究小組。
菲利翁在10月4日頒發的一篇博文中描述了這些論文若何驚人的類似,后來他決定與凱瑞一路探查背后的隱情。他們通過各類體例下載了這25篇論文的全文。而將這些論文用抄襲檢測法式iThenticate進行闡發后,他們并沒有發覺抄襲的環境。
不外,所有這些文章的會商部門都有雷同的文字陳述,只要句式上有略微變化。好比一篇文章寫道:“主要的是,相關研究對象和對照組的選擇尺度在這些所有的研究中都沒有明白描述,因而可能會對我們的成果形成影響(Importantly, the inclusion criteria of cases and controls were not well defined in all included studies and thus might have influenced our results)”;而另一篇則寫道:“主要的是,相關研究對象和對照組的選擇尺度在這些所有的研究中都沒有明白描述,而這可能也會對我們的成果形成影響(Importantly, the inclusion criteria of cases and controls were not well defined in all included studies, which might also have influenced our results)”。
別的,4篇文章中呈現了不異的語法錯誤——在“我們的成果過去沒有足夠的數據支撐(our results had lacked sufficient statistical power)”中無緣無故呈現“過去(had)”一詞。在試圖找出這些文章之間的聯系時二人留意到,文章作者們利用的文字描述似乎來自多個模板中,這意味著這些作者在成心調整這些文字的挨次,而這種方式恰是用來逃避抄襲檢測軟件的,這種手法被稱為“洗文”(text laundering)。
這些論文中的大大都提交于2013歲暮,而統一期間頒發的論文之間不成能彼此抄襲。因而菲利翁和凱瑞猜測,這些論文可能都出自統一個公司之手。在來自上海復旦大學的遺傳學家余垚的協助下,二人找到了一家公司,其網站告白稱能夠薈萃闡發論文。于是他們聯系了該公司并扣問辦事細節,公司暗示可在影響因子2或3的期刊上頒發薈萃闡發論文,價錢為每篇1萬美元。
以“代文”為環節詞在百度搜刮,能夠找到大量銜接這種營業的公司,這些公司一般都有一整套完美的流程。圖片來歷:網站截圖
2013年頒發在《科學》期刊上的一篇文章就是相關一次長達5個月的臥底查詢拜訪,查詢拜訪中發覺了許很多多雷同如許的公司。這些公司供給一系列的辦事,旨在幫人頒發能出此刻主要索引中的論文,包羅湯森透(Thomson Reuters)的科學援用索引和社會科學援用索引,以及愛思唯爾(Elsevier)的工程索引,而這些目標在中國很多研究機構內都是提職稱的主要參考。除了操縱客戶供給的數據創作論文以外,這些公司還能夠偽造嘗試數據、在已被期刊領受的論文中加作者,并出售寫好的原稿。
在論文成品中最受接待的就是薈萃闡發論文,可能是由于寫這類論文不需要原始數據。2013年6月頒發在《公共科學藏書樓·分析》(PLOS ONE)期刊上的一篇研究論文發覺,2003到2011年間,來自中國的薈萃闡發論文的增加速度比美國快16倍。若是在PubMed中搜刮其它研究趨向,可能會找出更多相關不合理科研行為的,可是菲利翁暗示,他和凱瑞目前籌算將留意力轉向其他處所,由于“我們不是打假人,而是大數據闡發專家”。(編纂:球藻怪)
這個大數據研究能發覺花錢請人做文字工作和完全讓人寫論文的區別么?若是數據是本人做出來的,花錢請公司幫手做文字潤色說不上是學術造假吧。文字雷同很有可能就是統一小我潤色形成的。潤色這種工作工作十幾年就有了,并且也不是中國獨有。有時候你投個程度高的,人家reviewer還會你找個英語好點的人幫你點竄一下稿子,難不成那些reviewer在激勵你學術造假?
頂[]評論
這個大數據研究能發覺花錢請人做文字工作和完全讓人寫論文的區別么?若是數據是本人做出來的,花錢請公司幫手做文字潤色說不上是學術造假吧。文字雷同很有可能就是統一小我潤色形成的。潤色這種工作工作十幾年就有了,并且也不是中國獨有。有時候你投個程度高的,人家reviewer還會你找個英語好點的人幫你點竄一下稿子,難不成那些reviewer在激勵你學術造假?
頂[]評論
1,我們也要看到外國的學術,免得只對中國悲傷……
2,中國的評價機制確實有點兒問題……就像他們那些臨床大夫(我是根本醫學生),既要完成臨床使命,又要有科研才能評職稱,這就有點兒過猶不及了,完全能夠有一方面有就能夠評職稱啊,否則逼著一群臨床的人集體搞科研,大部門人哪有精神和研究材料搞真正的科研(根本性研究該當是我們這些根本醫學的搞,他們該當是切近臨床的研究才合適學科分工吧)。當然,臨床簡直實欠好評估,大概也是一個緣由。
牢騷:比來評國,學校只認一作,所以雖然我有Plos one的二作,可是也不若有一篇焦點的一作,以至不如通俗期刊的一作……
別的良多華人PI對文章簽名環境也不是很客觀、誠篤(大概非華人PI也如許,可是還沒深切接觸過),良多時候小我會對能否簽名、作者挨次有很大的影響。昔時本科時聽本科老板說她在美國時隔鄰嘗試室一個華裔大老板的嘗試室發文章的時候把本人的妹妹簽名到作者里,雖然她妹妹是學數學的,而這個老板的嘗試室是動物學的。不外至多他妹妹也算學術圈兒的人,最狠的是把他哥哥也署進去了,而他哥哥底子不是搞學術的。聽說只是為了有幾篇SCI簽名,到時好申請綠卡……
中國人太聰了然,你懂得,估量從經濟學的市場角度來看,中國人會讓市場的效率提高良多良多,人底子想不起來的工作,中國人分分鐘想出來怎樣”操縱“”資本“
頂[]評論
p作為一個通俗的本科生,對于要本人發一篇論文需要做什么還沒有深刻的領會,可是有時候專業課要求本人查文獻寫一些文獻綜述,這時候就能發覺,下載的95%中文文獻,根基都是不異的一段話,大師拆開打碎了抄來抄去而且吧,援用同樣一句話弄的你都不曉得該用誰當文獻的好/p p/p p更有甚者,還碰到過兩篇一模一樣的文章,可是頒發在分歧期刊上,作者和單元也完全紛歧樣也是讓人醉了/p
頂[]評論
相關論文