當前位置:
首頁 > 天下 > 他們繪製了一張包含一千三百萬人的族譜

他們繪製了一張包含一千三百萬人的族譜

在過去的20年中,探宗尋源的家譜類網站吸引了超過1500萬受眾。你或許能發現家族中某人的不忠,也或許能和失散多年的表親重逢,Larry和Bernie就在《Finding Your Roots》上重逢了(註:《Finding Your Roots》是PBS的一檔節目,幫助各界名人探尋祖先,美國參議員Bernie Sanders就在節目上找到了自己的哥哥Larry Sanders,Larry中年時期移民去了英國,後在英國從政,現任綠黨發言人)。這是一件非常個人而又令人動容的事情。但如果你的族譜包含了成千上萬、甚至幾千萬人,它就不再是你個人的歷史了,它是整個人類的歷史。

商業家譜和社交網站Geni.com於2007年上線,它的目標是創建一張「世界性的族譜」。如今,網站用戶已經上傳了超過1.15億份個人資料,並通過婚姻和直系血緣關係聯繫在一起。最近,紐約基因組研究中心(New York Genome Center)、哥倫比亞大學、麻省理工學院和哈佛大學的科學家們將這些眾包的公開記錄整合成了大的族譜,每一份族譜的體量可能相當於一個小國家。3月1日,他們的分析在《科學》雜誌上發表,其中還包括一份1300萬人的族譜(劇透一下,美國演員凱文·貝肯就在其中),這也是目前已知最大的族譜。

研究團隊主要由遺傳學家和生物信息學家組成,他們在基因的基礎上發現了研究長壽的新視角。長壽一直是熱門話題,尤其是在矽谷,許多資金雄厚的初創公司都致力於尋找DNA老化的秘密,但這個課題始終難以攻堅。「我總不能在紐約地鐵里貼張海報說,『嘿,把你的老表都帶來,我們要研究長壽!』現在登錄Geni.com就能批量下載這些數據,這就方便多了。」該研究的作者亞尼夫·埃爾利希(Yaniv Erlich)說。

一年前,埃爾利希還在哥倫比亞大學研究DNA數據存儲、基因組編輯和群體遺傳。也是在哥大,他第一次接觸到了Geni的數據集。去年2月,他和其他研究者將報告的初稿發布在了biorXiv(生命科學預印本網站)上。發布前的一個星期,他暫時離開了哥大,去到Geni的母公司MyHeritage擔任首席科學官,該公司於2016年開始提供個人DNA試件。

研究人員利用圖論構建了這張包含6000人的家譜圖。綠色的部分代表跨越7代的個體,連接著他們的紅線代表婚姻。圖片來源:哥倫比亞大學

通過觀察300多萬對親屬的壽命差異,埃爾利希和他的學術夥伴——包括哥大時期的同事和紐約基因組研究中心的研究人員——發現,如今基因對壽命的影響只佔16%。之前的研究就已經預計到遺傳的作用在10%到30%之間,剩下的部分取決於生活方式、環境,甚至是運氣。即便你擁有了長壽基因,你也還是有可能出門就遇上車禍,或者災害來臨時你卻恰好在森林裡。埃爾利希說:「我們在基因組中能發現的信息可能會更少,從基因層面來說,你的生死幾乎是無法控制的。」

他說,這篇論文的主要目的是為了證明,眾包收集的數據與傳統的人口統計數據能夠提供一樣的分析視角,後者反而會花費更多的勞動力和資金成本;美國最近的一次人口普查花了130億美元。但這也不是所有人都認同的,「令人擔心的是,這種數據集的特殊之處我們尚且無法理解,」加州大學伯克利分校的人口統計學家喬什·戈爾茨坦(Josh Goldstein)說。只有你恰好生活在一個記錄完整的地區,或者你的親戚當中有個名人(見凱文·貝肯的例子),又或者只是單純地走運,你才有可能通過這些數據找到親人。

作者在研究過程中在儘力地解決這些問題,他找出了大約8萬名1985年至2000年間去世的佛蒙特人的死亡證明,並在Geni上收集了1000份1985年至2000年間去世的佛蒙特人的個人資料。他將二者進行對比,發現這兩組數據在社會經濟因素方面的匹配度極高,達到了98%的一致性。這個案例似乎可以證明,業餘的眾包數據某種程度上可以替代傳統的人口統計數據。

研究人員在Geni.com下載了8600萬份公開資料後,用數學圖表將這些數據整理成家譜。這張圖表中有7萬人,他們通過婚姻或共同的祖先聯繫在一起。圖片來源:哥倫比亞大學

這個網站是完全公開的,任何人都可以下載研究人員製作的家譜和人口統計數據,數據中的個人信息已被去除。用戶下載了這些資料後,理論上他們可以將這些龐大的譜系與其他資料庫相結合,例如MyHeritage、 Ancestry和23andMe(註:前二者為家譜網站,23andMe為基因鑒定網站)的DNA序列,繼而可以跨越代際去追蹤疾病和相關基因。戈爾茨坦說:「在未來的幾年裡,這些數據和其他公共資料庫的結合可能會產生巨大的累積效應。」

Geni目前已經建立了自己的數據介面,研究人員可以在資料庫中聯繫任何人(通過一個加密的、去識別的令牌驗證系統)以獲取用戶同意訪問他們的數據。埃爾利希說:「過去做實驗招募被試都得付錢,而且每個實驗只能產生一個數據集,用於一項特定的研究。但是現在我們可以利用系譜學家的這項新工程來收集家庭數據,進行基礎研究。」

我們的祖先拿起石器開始狩獵是否終結了人類的苦難地位?現在得出結論還為時過早。但現在卻是絕好的時機,讓你的家譜為科學做出貢獻。

(翻譯:都述文)

· · · · · · · · · ·

想要獲取更多有意思的內容,請移步界面網站首頁(http://www.jiemian.com/),並在微博上和我們互動,調戲萌萌噠歪樓菌→【歪樓-Viral】(請猛戳這裡)。

你也可以關注樂趣頻道的微信公眾號【歪樓】:esay1414


來源:Wired

原標題:RESEARCHERS USED THIS GENEALOGY SITE TO BUILD A 13 MILLION-PERSON FAMILY TREE

新聞報料

商務合作

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 界面新聞 的精彩文章:

【天下奇聞】非裔男孩更難實現「美國夢」 法國當街性騷擾或將現場被罰錢
想用武力征服世界 這位「鷹派中的鷹派」成了白宮國安顧問

TAG:界面新聞 |