Sci-Hub 已能免費下載幾乎所有論文,「付費讀論文」時代也許真會隨它終結
2月5日,全球訪問Sci-Hub的網路用戶。
Sci-Hub 上已經涵蓋了全部學術論文的 69%,而剩下的 31% 並非是它不能下載,而是沒人對網站提出獲取它們請求——是人們不需要的內容。
撰文 Lindsay McKenzie
翻譯 學術頭條
毫無疑問,著名的非法(根據美國法院的判決)盜版論文在線資料庫 Sci-Hub是非常受歡迎的。但是它的資源庫到底有多大?最近,賓夕法尼亞大學的生物學家丹尼爾·希默斯坦(Daniel Himmelstein)和同事開始在科學研究中心的幫助下試圖找出這個問題的答案。
他們的發現作為一篇預印本論文發表在7月20日在Peer J期刊的網站上。文章認為,通過Sci-Hub 可以立即獲取全部學術論文中的三分之二,希默斯坦表示,這一數字比他的預期要高得多。此外,對於受付費牆保護的研究論文,Sci-Hub 的覆蓋面更大,可以立即獲取在訂閱獲取期刊上發表的所有論文的 85%。對於一些大型出版商而言(如愛思維爾),其 97%以上的期刊文章目錄被存儲在 Sci-Hub 的伺服器上,也就是說可以免費獲取這些文章。
Sci-Hub 幾乎可以訪問科研人員想要閱讀的每一篇文章,並且對於該網站上沒有的文章也可以快速獲取,那麼,這個網站真的可以推翻傳統的期刊出版商嗎?希默斯坦接受ScienceInsider的採訪時推測,他的研究結果表示,這可能標誌著付費牆研究論文「終結階段的開始」。本文是這次訪談的簡編。
問:您為什麼要研究 Sci-Hub 的覆蓋面?
答:這一切開端是,3月19日 Sci-Hub 在推特上發布了其資源庫中所有文章的列表。我當時一看:「這下我們可以研究很多之前無法研究的東西了,可以研究這個網站的運營情況和資源的覆蓋範圍。大多數人都知道 Sci-Hub 提供了一些學術文獻的獲取許可權,但問題是究竟有多少文章。
問:具體的計算過程是怎樣的?
答:我們的主要步驟是弄清楚現存的學術論文總數。為此,我們使用了 Crossref 的數據,該資料庫具有日誌標識符或 DOI(數字對象標識符)資料庫。這個資料庫不是唯一的,但是迄今為止最常用的學術出版資料庫。做了一些排除後,我們編製了一份包括8160萬篇文章的清單。這一步很重要,因為這讓我們的計算方程有了分母。過去研究 Sci-Hub 覆蓋範圍的人並沒有採取這個正確的步驟,要搞清 Sci-Hub 的文獻覆蓋比例,需要先弄清文獻的總量。
問:您的研究的主要發現是什麼?
答:最簡單的結論是 Sci-Hub 上涵蓋了全部學術論文的69%。我們還發現,該網站會優先涵蓋封閉獲取期刊出版商和高影響力期刊的文章。我覺得很有意思的一點是,Sci-Hub 對愛斯維爾和美國化學學會的論文覆蓋率最高,這正是起訴 Sci-Hub 的兩家出版商。也許是因為意識到自己的整個資源庫都在 Sci-Hu b的涵蓋範圍之內。還有很多期刊上每一篇文章都能在 Sci-Hub 上獲得。
問:剩下的31%呢?
答:如果只是有一篇文章不在 Sci-Hub 的資料庫中,並不等於無法通過 Sci-Hub 獲得這篇文章。我們估計 Sci-Hub 能夠在99%的情況下完成獲取論文的請求,這表明它沒有涵蓋的31%的文章是人們不需要內容,沒有提出獲取請求。
問:您是否研究了不同學科領域的涵蓋範圍變化情況?
答:是的。不同學科領域之間的覆蓋率有一些變化,但我認為這個變化幅度可能不像人們過去猜測的那麼大。論文覆蓋率最高的是化學學科,達到93%,而最低的計算機科學為76%。這個結果可能與這些領域內論文發表活動有關。我們發現,封閉獲取期刊的覆蓋率比開放獲取期刊高。
問:Sci-Hub 面臨一些法律上的挑戰,你認為這些問題會阻止它的發展嗎?
答:我們在這篇論文中繪製了 Sci-Hub 與 Google 趨勢圖的歷史對比,Sci-Hub每次遭遇法律上的挑戰,都導致對該網站的谷歌搜索量的飆升,這表明,這些挑戰基本上是為 Sci-Hub 做了免費廣告。我認為官司糾紛無法阻止 Sci-Hub 的發展。
問:你認為 Sci-Hub 將來會如何發展?
答:在我們的論文中提到,未來的技術可以在不存在中心點故障的情況下為用戶提供文件託管服務,所以,通過 Sci-Hub 或與之類似的服務仍然可以訪問所有這些論文,但這些服務的背後找不到某個特定的域或個人。而現在,如果 Sci-Hub 的伺服器被發現,它們可能會被緝獲並銷毀。
問:您真的認為,將來會有圖書館員為 Sci-Hub 支付期刊獲取的費用嗎?
答:由於指示他人做下不法行為會引發法律問題,我認為圖書館員永遠不會這樣做。但在某種程度上,他們已經在這樣做了。現在有很多圖書館不能提供100%的學術文獻資料。在全球範圍內,能夠提供完全訪問許可權的大學所佔的比例很小。
問:出版商要怎麼辦,才可以阻止新的論文被添加到 Sci-Hub 的資源庫中?
答:確實可以採取一些辦法,但真的可能傷及自身。問題是,出版商的態度越保守,合法獲取論文的難度就越大,而這會促使更多的人去使用 Sci-Hub。
問:您希望這項研究可以造成哪些影響?
答:我認為這項研究展現的大局是,這是訂閱獲取學術出版走向終結的開端。我認為訂閱獲取模式將不可避免地走向失敗,更多的開放模式的出現將成為必須之事。做這項研究的一個動力是,我想促進這一必須之事更快地成為現實。
http://www.sciencemag.org/news/2017/07/sci-hub-s-cache-pirated-papers-so-big-subscription-journals-are-doomed-data-analyst
點擊展開全文
※聽「AI世界盃」冠軍分享:想投身AI浪潮,你的機會在哪裡?
※《自然》根據論文被第三方專利引用情況推出全球科研機構新排名:香港科大位列中國第一
※為什麼不存在「第三種性別」?數學解答性別進化謎題
※「墨子號」量子衛星實現星地量子密鑰分發和地星量子隱形傳態,圓滿實現全部既定科學目標
※讀世界頂尖學術期刊 Nature 精選集 共品科學下午茶:《〈自然〉百年科學經典》系列圖書閱讀分享會
TAG:科研圈 |
※同行評審是這樣略讀論文的!Ian Goodfellow實力「嘲諷」了一波
※同行評審是這樣跳讀論文的!Ian Goodfellow「嘲諷」了一波
※為什麼有人會讀論語讀到手舞足蹈?經典的魅力,難以表述
※給正在讀論文的你:如何高效閱讀文獻?
※悟讀論語為什麼要讀詩
※如何高效讀論文?
※悟讀論語為什麼「唯法是圖」行不通
※學佛必從「讀論入手」?否!若論涵養信心,讀經更好
※《于丹讀論語品莊子》:人生有很多玩法,何必讓自己活得這麼累!
※《不讀論語枉少年》
※始有齋讀論語:「忘了三綱
※悟讀論語修身處世,一誠之處更無餘事
※我勸弟弟讀論語
※寫在最前面-開始《我的品讀論語之旅》
※我和孩子一起讀論語的一點點體會
※隨筆:讀論語自得之樂
※今日3篇必讀論文,英偉達GAN神作、自編碼器綜述及擬人機器人系統
※念佛與閱經讀論是什麼關係?
※讀論語:學而篇
※全解卷積神經網路,並分享9篇必讀論文