論文被搶發後,他們卻反超了對手:MIT團隊揭示背後原因是……
MIT 兩位經濟學家發表了一篇論文,指出被搶發的論文在期刊影響力和被引數方面確實會吃虧,但整體上損失並沒有研究者們所想像的那麼大,有的甚至還能登上《自然》或《科學》,後來居上。他們還指出,對被搶發的過度擔憂可能會損害科學的質量。
圖片來源:Pixabay
撰文 戚譯引
「科研圈」報道·keyanquan·
人們常說「歷史不會記住第二名」,在科學研究中,搶佔先機往往意味著得到更多的關注,甚至有可能涉及未來的直接利益,例如專利權和榮譽稱號。不過,有沒有辦法量化研究論文被搶發(scooped)的損失呢?
麻省理工學院(MIT)的經濟學家 Ryan Hill 和 Carolyn Stein 以結構生物學為例,分析了搶發和被搶發論文的發表和引用情況,同時調查了該領域中研究者的看法。他們發現,和首發論文相比,被搶發的論文發頂刊概率下降了 18%,被引數下降了 28%,但這些差距遠小於研究者們的心理預期。這項研究的全文已經在 MIT 網站上公開。
有多少論文被搶發?
量化研究論文搶發並不容易,因為很難通過資料庫篩選哪些論文之間存在搶發的情況,研究作者們認為主要有三個原因:首先,這些研究的問題需要有明確的定義,並且需要採用相同的方法;其次,研究需要回答相同的問題;最後,當一項研究工作被搶發之後,其他團隊的同類項目可能會被放棄,或者論文可能因此無法發表,這些記錄是無法在出版資料庫中找到的。
為了克服這些困難,研究作者們選擇了蛋白質數據銀行(Protein Data Bank),這個資料庫收錄了大量的蛋白質結構測定研究。這些研究的問題非常明確,方法也是高度相似的(資料庫中 85% 的研究使用了 X 射線衍射法)。更重要的是,一些被搶發後無法發表的論文也在這個資料庫中。
對於蛋白質結構測定研究,幾乎所有期刊都要求在論文發表前把結果錄入 PDB,因此 PDB 中的項目包含兩個關鍵日期:一個是錄入日期(deposit date),這是科學家第一次將數據錄入的時間,通常在對出版社投稿的前後;另一個是發布日期(release date),即相關論文發表的時間。當論文發表之後,錄入日期和測定結果才會對外公開;如果論文一年內仍然沒有發表,這些信息將在達到一年期限之後默認公開。在這項研究中,搶發被定義為對於同一蛋白質結構,在首個發布日期之前有兩個或以上競爭團隊錄入了相同信息的事件。
根據這一定義進行篩選後,研究作者們一共發現了 1630 次競爭,涉及 1999 到 2017 年間發表的 3319 篇論文。在同一時期的論文總數為 64018 篇。論文作者指出,這表明大約 5% 的結構生物學項目在發表階段面臨激烈競爭。
被搶發的損失有多大?
統計發現,被搶發的團隊論文最終發表的可能性降低 2.5%,並且發表在最頂尖的 10 家期刊的可能性下降了 18%。被搶發的論文也有可能登上《自然》、《科學》這樣的期刊,但是這些論文中有 90% 是在評審階段被搶發的,60% 是在被期刊接收後被搶發的。如果被搶發的論文發的是PLoS One之類的期刊,那麼評審期間被搶發的只佔 60%,接收後被搶發的略高於 20%。
研究作者們總結:「儘管無法直接統計論文被搶發之後遭遇拒稿的情況,但我們可以根據這些規律推斷,頂級期刊更不願意接收在提交前或評審早期就遭遇搶發的研究。」一般而言,被搶發的論文更有可能發表在評分較低的綜合期刊,或高度專業化的結構生物學期刊。
在被引數方面,搶佔先機的論文在 5 年內的平均被引數是 34,而被搶發的論文被引數減少了 28%。被搶發論文也更難成為熱門論文,它進入當年被引數前 10% 的可能性下降了 25%。研究作者們認為之所以出現被引數的差異,主要是因為首發論文通常能登上更好的期刊。這點再次體現了期刊編輯和審稿人在科學中發揮的重要作用。在控制了期刊的差異之後,被引數差異將下降到 5%。
在大眾媒體曝光上,被搶發的論文也處於劣勢,其被新聞或科普媒體引用的頻率下降了 11%,在 Twitter 上被提及的頻率也下降了 10%。而在長期職業發展方面,被搶發的作者們未來的被引數下降了 23%,年輕科學家受到的影響更大,被引數將下降 28%,而資深科學家的「損失」只有 13%。
被搶發的論文還有機會翻盤嗎?對此,研究得出了一個不知道是好是壞的結論:研究團隊所在機構的聲望在其中發揮著重要作用,知名大學、研究所的研究有可能「後來居上」。如果是某個知名機構搶發了不知名機構的研究,他們的論文在未來的相關引用中將佔到 65%;但如果是某個不知名機構搶發了知名機構的研究,他們的論文在未來的引用中只佔 47%。(擴展閱讀:出身和平台哪個對學者更重要?他們在二十萬篇論文中找到了答案)
了解真實的學術競爭
兩位作者同時聯繫了 PDB 資料庫中的通訊作者,提出了一個虛擬的被搶發場景,調查他們的反應,最終收到了 915 份有效回復。他們發現,科學家們大大高估了論文被搶發的可能性和後果的嚴重性。
受訪科學家們認為,在從提交到發表之間的時間段,論文有 25% 的可能被搶發,但根據 PDB 資料庫統計,這樣的情況只佔 3%。他們認為被搶發的論文被發表的可能性只有 66%,遠低於實際的 86%。最後,他們還認為和贏家相比,被搶發的論文被引數將下降 59%,也遠高於實際的 28%。和資歷較深(被引數較多)的科學家相比,資歷淺的科學家對被搶發的後果更加悲觀。
因此,兩位經濟學家在論文中寫道:「這樣的對比表明,科學家可能對論文被搶發的可能性和造成的損失有著過度擔憂;如果能更好地告知他們學術競爭的真實影響,也許可以緩解他們對於學術競爭和風險的擔憂。」
儘管研究結果不一定適用於其他的科研領域,但它為理解搶發現象提供了很好的參考。對於被搶發的過度擔憂不僅會為研究人員帶來壓力,還可能對科學造成負面影響。研究作者指出,這樣的擔憂可能會促使某些科學家倉促發布還不完善的研究結果,或採取不必要的保密措施,損害科學的公開透明。
為了改變這樣的現狀,作者們還提出了一些具體建議,例如:期刊應當設立一定的「寬限期」,讓論文在被搶發後的幾個月內也能被接收;通過預印本形式,允許研究在早期階段搶佔先機;通過直接經費資助,鼓勵進行重複研究。他們在論文中總結:「如果對重複研究的激勵措施不足,並且重複研究的成本高昂,那麼快而不精的研究將可能成為普遍現象,令科學整體上受到損害。」