南方人和北方人的基因差異有多大?
大家好,我是各色 DNA 的基因產品總監雷雷。
大象公會的讀者可能是對中國地域差異最關心的人群,今天,
我想跟大家深度解讀如何從基因上來看地域差異
,並分享各色 DNA 新版祖源基因檢測報告的「秘密」,這也是各色 DNA 第一次在其他平台上講述自己的演算法。
我先問三個問題為大家熱身,它們的答案藏在文章里:
1、祖源檢測,測的是你的祖先生活過的地方嗎?
2、南方漢族和北方漢族真的有基因差異嗎?
3、四川人的基因更接近貴州,還是浙江?
全文 4600 字,需要足夠的耐心。如果你已經關注各色DNA 很久了,文末有
京東商城雙 12 限時優惠
,不要錯過今年最低價。
如果你希望獲得別處沒有的信息,這一定是你能看到的最全的祖源知識通關攻略,配合祖源分析報告食用,佐以中國歷史,你會發現基因測祖源遠比「曬外國血統」更有趣。
首先要告訴大家,各色 DNA 的祖源檢測結果不久前升級了,祖源部分由原本的 14 個地區,細分了成全世界 59 個地區和族群。
新版的祖源檢測報告長這樣??
攻略 1 :我的祖源結果是怎麼得出來的?
我發現人們對祖源檢測存在一個誤解:「祖源測的就是我祖先曾經所在的地方。」
其實並不是,
祖源分析的參考數據都是連續幾代生活在這個地方的現代人
。
拿北方漢族來說,當我們找到足夠多長期生活在北方漢族地區的人,我們就構建了一個北方漢族地區的參考資料庫。
2016 年,當我剛開始做中國人祖源解讀的時候,我發現,幾乎沒有中國不同地域的基因參考資料庫。
即使在全球用戶量最大的 23andMe(目前可以探測全球 150 個國家和地區的祖源),中國人也只是被粗略劃分為南方人和北方人。
一個典型的中國人在23andme的祖源成分檢測結果
在我們去年9月份發布第一版祖源解讀的時候,我們積累了第一版中國人族群資料庫。
我們將生活在中國的人分成了 6 個地區,將國外人口分成了8個地區。據此給出了每個人的比例解讀,並且邀請大家繼續參與家庭出生地的調查。
今年,我們有了更大更豐富的族群資料庫。升級之後,各色的祖源由原來 14 個地區,升級為 59 類,主要是源自於祖源參考數據集的優化。
我們積累的參考資料庫包括有:
由數萬名各色用戶貢獻的 DNA 數據
國際千人基因組計劃中的公開數據
(http://www.internationalgenome.org/category/population/)
斯坦福大學人類基因組多樣性研究計劃中的公開數據
(http://www.hagsc.org/hgdp/ )
由於各色用戶絕大部分是中國人,因此在收集和整理國外不同族群的參考數據時,我們仍然重點分析中國人的數據,特別是漢族群體。
攻略 2 :測出來的「外國血統」,到底怎麼理解?
我看到很多人會樂於在社交網路上分享自己的「5% 美洲土著基因」,這聽上去很酷。
它的科學解釋是:祖源成分並不代表你一定有這裡的祖先,而是你的祖先有 5% 的可能是這裡人。
人有 23 對染色體,22 對常染色體,1 對性染色體(女性是 XX,男性是 XY )。做祖源成分分析使用的是 22 對常染色體數據。
人類基因組中,大約 99.9% 的 DNA 序列都相同。所以要通過祖源成分分析獲得你屬於某一個或幾個地區或族群的「可能性」,第一步是收集在不同地區和族群分布有差異的基因位點。
比如,影響人是否有腋臭的基因位點是 rs17822931,這個點基因型為 C 的人,體味更重一些。
rs17822931 在世界不同地區的分布差異很大,在非洲有 99% 的人攜帶 C ,在美洲和歐洲攜帶 C 的比例是 86%。
而在東亞攜帶 C 的比例只有 22%,大部分人東亞人在這個位點是 T型,表現為乾燥的耳垢和更輕的體味。
如果一個人 rs17822931 檢測結果為 TT,從概率上來講,他更可能是一個東亞人。
rs17822931 在世界各地的分布,圓圈白色部分指的是 「T」
所以,當我們找到足夠多像 rs17822931 這樣的基因位點,即在不同地區,不同人群中基因位點類型頻率分布有差異的位點, 我們就可以去推測你的祖源成分。
族群1 | 族群2 | 族群3 | 族群4 | |
位點1(C) | p11 | p12 | p13 | p14 |
位點2(A) | p21 | p22 | p23 | p24 |
位點3(G) | p31 | p32 | p33 | p34 |
祖源參考數據集示例
計算祖源成分的演算法上,我們使用的是美國加利福尼亞大學洛杉磯分校相關人員研發的,也是目前使用比較廣泛的專門計算祖源成分的方法—— ADMIXTURE(http://software.genetics.ucla.edu/admixture/)。
其核心演算法是極大似然估計法(Maximum Likelihood Estimate,MLE),簡單說就是通過你的基因數據,計算出你最可能由哪幾種族群組成,以及相對應的百分比。
所以,如果改變祖源地區的劃分類別,檢測結果就會發生變化。
攻略 3 :你的基因中藏了哪些地域的秘密?
各色的祖源主要是以地域而非民族為劃分標準的。因為,大部分中國人是北方漢族或南方漢族主體,如果用民族來做祖源劃分,一個漢族人的祖源結果會比較「無聊」。
其實,除了民族之外,基因中還蘊藏著非常豐富的地域差異信息。
今年新發表的一項大規模中國人祖源研究,根據 19 個省和直轄市 共 11670 名漢族人的分析發現:
漢族人南方和北方之間的差異是最大的。
北方省市中,甘肅、陝西和山西,與其他省市(東北三省、山東和河南等)有差異。
相比北方漢族呈現出來的東西差異,南方漢族則呈現南北差異,即長江流域(江蘇、安徽、湖北、浙江等)和東南沿海(湖南、福建和廣東)存在差異。
各色選擇 3620 個代表用戶,得到了跟上面這個研究類似的結果:
●
當地各色漢族用戶較少的國內省市和自治區未包含,圖中的分類「中國」為用戶填寫的原始數據
這張結構圖可能看上去有點費解,你記住這幾點就好了:
中國漢族可以分為南北兩部分,南方漢族和北方漢族。
北方漢族中,甘肅與吉林省和其他省市存在差異,這可能是因為甘肅與新疆和內蒙相連,長期的民族融合交流會影響漢族的特異性;而吉林省滿族人聚居,且東臨朝鮮半島。
天津市明顯區別北方漢族的表現,讓我們有些費解。希望有更多天津土著參與我們的檢測,期待未來我們可以一起破解這一謎題。
南方的劃分中,貴州省、重慶市和雲南省與其他地區存在差異。其他地區可以分為長江以南和東南沿海兩大部分。
根據層次聚類和 PCA 分析結果,我們選擇了區域而非民族(南方漢族和北方漢族)來給大家進行祖源成分劃分。
中國歷史上多次人口遷徙和民族融合,比如四川省與湖北、江西和浙江等省市比較類似,我們都將其定義為「長江以南」地區。這也呼應了清朝初期「兩廣填四川」的人口遷移史。
北方中部 | 你的祖先是最早的「華夏兒女」。根據《史記》記載,黃帝與炎帝的戰爭即發生在今天河北山西一帶, 歷史上頻繁的戰亂也帶來了西北少數民族的融合和遷徙。你們愛吃麵食和酸辣口味,通常有高大強壯的體魄。 | 北方蒙古人種|河北|山西|陝西|臉長且平|鼻高|單眼皮更多|關羽|張藝謀|郭晶晶|麵食 |
北方東部 | 你的祖先分布在黃河中下游地區和華北平原,在兩千多年的時間裡,原本居住在此地區的漢族不斷向外擴張,並和別的民族融合。 | 北方蒙古人種|山東|河南|高大|長方臉|鼻樑高|深眼窩|黃渤|孔丘|麵食|鮮香|生食蔥姜 |
長江以南 | 2000 多年前,北方漢族和漢文化逐漸南下,改變南方原住民的遺傳結構。你可能是北方民族南下後,與侗傣、苗瑤等南方原住民族共同繁衍的後代。相比北方漢族,南方漢族基因的內部差異更大。 | 南方蒙古人種|浙江|江西|湖北|四川|安徽南部|臉較闊|肩膀窄|軀幹長|大米|咸粽子|甜豆腐腦 |
東南沿海 | 中國歷史上有數次人口南遷,在漫長的民族融合過程中,你的祖先選擇定居沿海。沿海人民坐擁海洋寶庫。豐富的海洋資源,頻繁對外交流的港口都讓你的祖先從古時候就享受到繁榮的經濟。 | 南方蒙古人種|廣東|福建|湖南|約2.1 億|鼻子較寬|鼻尖上翹|身高中等|粵方言|閩方言|客家方言|沿海地區口味清淡|內陸嗜辣人 |
各色漢族分類
攻略 4 :怎麼理解報告中的祖源百分比?
如下圖,我出生在山東,我有 34.44% 的北方東部成分。這個數字的科學解釋是,我來源於北方東部人的可能性是 34.44%。
我們把你 DNA 數據中的大量基因位點,和祖源參考數據進行比對,得到了你的綜合預測結果。即你
來源於這個族群的概率
。
攻略 5 :少數民族的參考資料庫是怎麼來的?
我們用戶中數量比較多的少數民族,如藏族、新疆地區少數民族,以及西南少數民族,都使用用各色用戶數據作為參考資料庫。
但由於其他少數民族的用戶數量較少,我們參考了國外的公開資料庫。
達斡爾族 | 你的祖先驍勇善戰,自明清以來為捍衛疆土披甲守邊,是中國境內最接近契丹人後裔的族群。 | 蒙古人種|直發|有內眥褶|鏟形門齒|約 13 萬人|達斡爾語|薩滿教|藏傳佛教|柳蒿芽|曲棍球 |
傣族 | 你的祖先們可能來自川北陝南地區,因戰亂不斷向南遷移,隨後在雲南、東南亞等地定居發展。也有學者認為你的祖先們原本就定居自紅河以西到伊洛瓦底江上游,是該區域的原住民。 | 蒙古人種|泰國|緬甸|中國雲南省西雙版納|普洱|1500-2000 萬人|男性多用白布或青部包頭|女性大多束髮|漢藏語系壯侗語族壯傣語支|傣語|西雙版納傣文|菠蘿飯|竹筒飯|俸正傑|毛相|蘭昊宇 |
錫伯族 | 你的祖先可能是中國古代鮮卑人或者女真人的後裔,你們主要分布在中國東北,還有一部分在新疆。你們注重禮節,錫伯族西遷的歷史壯舉也一直被銘記。 | 遼寧|新疆|錫伯語|阿爾泰語系通古斯語族滿語支|190481人|薩滿教|喇嘛教|抹黑節|西遷節|注重禮節|錫伯大餅|全羊席 |
鄂倫春族 | 17 世紀以前,你的祖先生活在黑龍江以北,貝加爾湖以東直至庫頁島的廣闊土地上。遊獵是他們的生活方式。17 世紀,部分鄂倫春人南遷到大小興安嶺地區。你的祖先們能歌善舞,勇敢擅獵,被譽為「興安嶺上的獵神」。 | 北方蒙古人種|黑龍江|內蒙古|8659人|高鼻樑|小眼睛|大耳多|尖下巴|薩滿教|獸肉|米|面|五味子湯|樺樹汁 |
赫哲族 | 赫哲,意為居住在「東方」及江「下游」的人們。你的祖先傳說是女真部落的一支,在嚴寒地帶狩獵,捕魚和歌唱。每兩年一次的烏日貢節是你們的盛會。 | 通古斯人種|赫哲語|阿爾泰語系滿-通古斯語族滿語支|5354人|薩滿教|中國黑龍江|俄羅斯|漁獵民族|吃生魚|魚皮部落|傳統赫哲族衣服都用鹿皮和魚皮製作|烏日貢節|烏蘇里船歌|伊瑪堪說唱|德蘇·烏札拉|韓庚 |
畲族 | 畲,意為「刀耕火種」,是東南沿海主要的少數民族。祭祖是你們最隆重、最普遍的信仰習俗活動。重視文化傳承,淳樸熱情和勇於開拓一直流淌在你們的血液中。 | 福建|浙江|散居民族|女性頭佩「三把刀」習俗|喜愛武術|710039人|第十九大少數民族|畲話|漢藏語系苗瑤語族|萬物有靈|佛教|雙條落|三月三 |
藏族 | 4000 多年前,你的祖先曾在西藏雅魯藏布江中游兩岸聚居,他們是世界上最早佔據高海拔地區的現代人。 | 北方蒙古人種|西藏|青海|甘肅|四川|鼻子窄|臉型平|胸圍大|松贊干布|倉央嘉措|萬瑪才旦|牛羊肉|青稞酒 |
新疆少數民族 | 你的祖先們可能經過中亞,那裡的人們從未停止過遷徙和交流,在史前就可能與其他人種融合。 你的祖先可能與東歐和西歐有著相似的人體體質學和遺傳學特徵。維吾爾族和哈薩克族是新疆少數民族的主體。 | 高加索人種和蒙古人種的融合|新疆|亞歐混合|阿曼尼莎汗|塞努拜爾·吐爾遜|馬木爾|饢|磚茶|奶茶|手抓飯|奶疙瘩 |
蒙古少數民族 | 美麗的額爾古納河孕育了你的祖先。你的祖先們是馬背上的王者,他們征服的腳步橫掃整個大陸。他們曾經佔有世界上 1/4 的陸地,西起多瑙河,東至黑龍江,都曾是他們放馬的牧場。 | 北亞人種|成吉思汗|忽必烈|騰格爾|白岩松|1000 萬人|黃皮膚|高顴骨|鼻根低|扁寬臉|蒙古褶|漢語|蒙古語| 薩滿教|藏傳佛教|牛羊肉|奶製品|內蒙古|新疆|東北|河北|蒙古國|俄羅斯| |
西南少數民族 | 東臨中南,北依西北,人口最稠密、交通最便捷、經濟最發達——你的祖先曾在這裡歡歌、農耕。他們有自己的語言、自己的信仰、自己的儀式,男耕女織、黃髮垂髫,人人歡聲笑語、自給自足。你的根就在這片世外桃源之中。 | 南方蒙古人種|四川|雲南|貴州|橢圓臉|直眉|重瞼|鼻樑直|正唇|嘴唇中等厚|宋祖英|楊麗萍|食材多樣|口味多樣 |
各色少數民族分類
最後,我想自曝一下我們的「bug」:
由於這一版的局限性,參考數據集並未涵蓋世界上所有的祖源成分。比如我們並未包含法國人的參考數據,所以會輸出的結果是英國人和西班牙等法國臨近地區的祖源成分結果。這可能會讓一個法國用戶感到困惑。
基因產品的演算法和解讀,將是持續優化的過程。在開發基因產品的時候,我常常會想,如果我們能有有數百萬用戶,祖源檢測解讀一定會在現有的程度上豐富更多吧。
所以,我非常想邀請你們參與進來,和各色共同完善中國人的祖源資料庫。
如果你還沒有自己的基因檢測報告,京東商城雙 12 限時優惠,和父母一起測,三人更優惠,平均低至 300 元/人。
微信掃碼直達優惠
點擊閱讀原文鏈接直購
※有人安靜地反抗暴政,有人決定付諸行動
※漢奸的結局:汪兆銘和陳公博
TAG:大象公會 |