楠木軒

我國科學家創新古DNA技術,揭秘中國史前人羣遷徙動態與族羣源流

由 睢風娥 發佈於 科技

福建奇和洞約8400年前的2號個體頭骨。平潭國際南島語族研究院 範雪春供圖

  我們是誰?我們從何而來?通過中國南北方人羣的古基因組研究,逐步揭開東亞尤其是中國史前人羣南北格局、遷徙擴散及遺傳混合歷史的面紗!

  2020年5月15日,美國《科學》(Science)期刊以Research Article的形式正式在線發表付巧妹團隊獨立完成多家單位參加的研究論文《Ancient DNA indicates human population shifts and admixture in northern and southern China》,從遺傳學角度揭開了有關中國南北方史前人羣格局及遷移與混合這一重大學術問題上的若干謎團,是一項有關中國、東亞古人羣遺傳特點、基因交流與遷徙融合的重大科學發現和研究成果。相關研究成果呈現了中國史前人羣遺傳與演變歷史直接呈現給學術界和社會大眾,填補了東方尤其是中國地區史前人類遺傳、演化、適應方面的重要信息。

  該文系首次正式發表大規模中國南北方史前人類基因組分析結果,為探源華夏族羣及其文化和修正東亞南方人羣演化模式做出了重大貢獻。在中華民族探源方面,發現中國、東亞主體人羣連續演化是主旋律,中國南北方古人羣早在9,500年前已經分化,至少在8,300年前南北人羣融合與文化交流的進程即已開始,4,800年前出現強化趨勢,至今仍在延續。在修正東亞南方人羣演化模式方面,明確中國福建及周邊距今8,400年的古南方人羣不屬於 “第一層”祖先人羣,即來自南亞及太平洋島嶼的古人羣。事實上,他們是南島語系人羣(現今主要生活在台灣島及太平洋島嶼等地)的祖先來源;整個東亞沿海族羣之間都存在遺傳聯繫,這為修正此前流行的該地區古人羣來源的“兩層假説”提供了遺傳學基礎,併為農業-語言傳播模式及相關研究提供重要證據。該成果通過改進、創新古DNA技術首獲中國南方大陸人羣核基因組,使大規模研究東亞人羣遺傳信息成為可能,相關技術有着非常重要的應用前景。

  這一學術成果是中國科學院推進率先行動計劃,依託生物演化與環境卓越創新中心,面向學科前沿,加強聯合交流,圍繞東亞人類古基因組學研究所取得的重大突破,也是與國家文物局共建舊石器時代人類生存與演化重點科研基地、跨學科交叉與多機構合作取得的重大發現,其獨立自主研究對於有效保護和利用我國人類遺傳資源與信息,對於中華民族和華夏文明探源工程,具有重大的學術價值和社會意義。

  一、首次正式發表中國南北方人羣規模性、系統性的史前基因組研究

  近年來,與東亞毗鄰的東南亞、西伯利亞等地的古代人類遺傳演化研究已取得很多成果。但迄今為止,東亞,尤其是中國南北方分別作為稻作和粟作農業的起源中心,史前人類基因組的相關信息所知甚少。此前,中國科學院古脊椎動物與古人類研究所付巧妹團隊關於四萬年前田園洞人的研究揭示出東亞史前人羣的多樣性及遺傳歷史的複雜性,為東亞人羣古基因組研究打開局面,同時也激發出對不同時期、不同區域的東亞古代人類樣本進行系列採樣研究的迫切需求。

  為解決這一問題,付巧妹團隊與福建博物院考古研究所、平潭國際南島語族研究院、福建龍巖及漳平市博物館、山東考古與文物研究院、吉林大學、山東大學、山東省博物館、北京大學、內蒙古文物與考古研究所、西北大學等多家單位合作,共同開發的具有關鍵作用的古DNA技術,成功捕獲測序中國北方山東、內蒙古及南方福建、毗鄰亮島和鎖港等地11個遺址25個9,500-4,200年前的個體和1個300年前個體的基因組(圖1A和B)。這為大時空框架下研究東亞古人羣,尤其是現代人的遷徙與演化歷史提供了重要的遺傳學證據,這也是首次針對中國南北方人羣開展的時間跨度最大的系統性古基因組研究。

  二、古DNA尋根東亞南北方人羣 探源華夏族羣與文化

  (1)洞察東亞史前人羣格局,揭示中國南北方古人羣的遺傳差異、融合進程與主體連續性。

  研究所涉及新石器時代早期人羣樣本,包括來自北方山東、內蒙古地區5個遺址(扁扁洞、小荊山、小高遺址、博山遺址、裕民遺址)距今9,500-7,700年的7個個體,及南方福建、台灣海峽2個遺址(奇和洞、亮島)距今8,400-7,600年的3個個體。通過研究這些人羣的基因組發現,在沿着黃河流域直到西伯利亞東部草原的人羣,至少從9,500年前起都攜有一種以新石器時代山東個體(圖3)為代表的古北方人羣成分而中國大陸沿海及台灣海峽島嶼人羣至少從8400年前起就攜有一種以新石器時代福建及其毗鄰島嶼個體為代表的古南方人羣成分(圖1C和D),且這兩種成分截然不同(圖3A)。然而隨着時間的推移,東亞大陸南北方人羣之間的這種差異性和分化程度逐漸縮小(圖4A),這種變化暗示着自新石器時代以來南北方之間頻繁的人羣遷移與混合。此外,在8,300-7,700年山東人羣中發現古南方人羣聯繫(圖2B)及在約8,300亮島1號人發現有少量古北方人羣的影響(圖2D),反映南北方人羣已經開始互動。

  研究數據顯示,大概在新石器時代晚期,人羣的遷移和融合繼續對東亞人羣產生影響。南方以距今4,800-4,200年的鎖港、溪頭村、曇石山等遺址13個個體為代表的新石器時代晚期人羣表現出與東亞北方沿海人羣具有基因上的聯繫,並且這種聯繫是雙向的,南方人羣遺傳成分也向北影響(圖2A)。

  研究觀察到,現今的東亞人羣,不管是來自北方還是南方,都同時混合有古北方人羣成分(以黃河沿岸的山東人羣為代表)和古南方人羣成分(以福建與台灣海峽島嶼人羣為代表),但古北方人羣成分影響更為廣泛(圖2C和圖3C)。而與福建奇和洞人相關的古南方人羣成分在中國南方大陸大量下降 (圖3C和3F)。該結果表明人羣的遷移,包括新石器時代南北方人羣之間的互動融合,以及新石器時代以後黃河以北人羣向南的大量遷移,基本構成了現今東亞南北方人羣的基因組成。

  (2)闡明東亞自9,500年以來主體人羣連續性,為華夏民族的探根溯源提供重要證據

  中國人羣與歐洲人羣,自新石器時代以來的演化歷程差異較大。在約9,000年前農業出現以來,歐洲人羣不斷受到近東農業人羣及歐亞草原人羣等外來羣體的大換血。也就是説,外來人羣一直在重構歐洲人羣遺傳信息,對現今歐洲人產生重要影響。在中國,南北方人羣雖早在9,500年前已分化,但南、北方同期人羣的演化基本是連續的,沒有受到明顯的外來人羣的影響,遷徙互動主要發生在東亞區域內各人羣間。

  有趣的是,研究發現中國南北方現今大部分省市的漢族人羣,所攜有東亞古北方人羣成分和古南方人羣成分的混合比例基本相似(圖4B)。此外發現中國古南方人羣成分在現今南島語系人羣中占主導地位(圖4C),確認南島語系人羣起源於中國南方。這些研究結果都為華夏民族的形成演化研究及中華文明的探根溯源提供了重要線索和佐證,對於我國考古界、史學界正在開展的華夏文明溯源這個重大學術工程提供了重要的信息與助力。

  三、明確南島語系人羣起源 修正東亞南方人羣“層次”

  (1)確認最早南島語系人羣的祖先來源,且首次明確時間可追溯至8,400年前

  研究發現,古南方人羣成分雖然在現今東亞大陸人羣中所佔比例較小,卻對其他地區的人羣具有廣泛的影響。現代遺傳學和新石器時代中期以來的考古學材料雖已暗示了南島語系人羣與東亞南方大陸人羣之間的聯繫,但對其起源地卻一直沒有定論。付巧妹團隊為此提供了較為確鑿的遺傳學證據。他們通過研究發現,現今廣泛分佈於台灣海峽、東南亞和太平洋西南部島嶼的南島語系人羣,與新石器時代的中國南方沿海人羣有着非常密切的遺傳聯繫(圖1C和圖2A)。這表明最早的南島語系人羣起源於中國南方的福建及其毗鄰地區,且首次明確將時間追溯到8,400年前。這是第一次通過古基因組數據明確中國8,000多年前的古南方人羣是南島語系人羣的祖先來源。

  值得一提的是,福建8,400年前的奇和洞人相較於現今生活在東亞北方和西部人羣(如達斡爾族人羣)而言顯示與東亞現今中部和南方人羣(如漢族和傣族人羣)之間存在更多的遺傳聯繫(圖4C),且與台灣島的阿美族和泰雅族人羣具有最強的遺傳聯繫(圖4C和4D),反映出現今族羣之間的聯繫性。

  (2)新石器時代早期中國南方福建等沿海古人羣不屬於“第一層”人羣,且對現今人羣影響很大

  有頭骨形態學提出有關東亞與東南亞祖先人羣的“兩層假説”(Two Layers Model),認為距今4,500年及以前,中國東南沿海同東南亞地區一樣,普遍存在着以狩獵採集經濟和屈肢葬為特點的狩獵採集人羣(澳美人羣Australo-Papuan),且本研究涉及的福建奇和洞人與台灣海峽亮島人等古南方人羣便屬於這“第一層”人羣;他們同從事農業經濟的“第二層”農業人羣(現代東亞人)是截然不同的。在農業-語言傳播模式中,正是後者“第二層”農業人羣的擴張取代了“第一層”狩獵採集人羣,由而推動了東南亞及太平洋島嶼的新石器文化和南島語系人羣的形成。

  然而,付巧妹團隊通過此次古DNA研究,發現此前因為頭骨特徵被歸入“第一層”的以奇和洞人和亮島人為代表的古南方人羣,實質上並沒有明顯屬於“第一層”人羣的遺傳信息,反而與現今東亞人羣、南島語系人羣有着直接而延續的遺傳關係。這表明在至少8,400年前,組成現今東亞人羣、南島語系人羣基因結構的主要祖先羣體之一已經在東南沿海出現。這一研究成果,將推動對農業-語言傳播模式和南島語系人羣形成等理論的進一步探討研究。

  (3)遷徙和流動在亞洲沿海人羣史前史中起着重要作用

  該研究發現,東亞和東南亞地區所有沿海人羣之間很少存在遺傳隔離的情況。數據顯示,大部分新石器時代晚期的東南亞人羣都混合有當地古老的和平文化人羣(Hòabìnhians)和中國古南方人羣相關遺傳成分,其中自越南4,000多年前的人羣尤其顯示與新石器時代晚期中國沿海的福建人羣有着非常密切的關係。此外引人注目的是,這種沿海人羣之間的遺傳聯繫進一步向北延伸。

  日本羣島的繩紋文化(Jōmon)人羣在很早以前便與東亞人羣分離。之前研究認為其與東南亞地區的古老和平文化人羣密切相關。然而付巧妹團隊在結合新石器時代中國南北方人羣基因組進行比較分析時,卻發現一個2,700年前的繩紋文化(Jōmon)個體雖含有早於東亞人羣的古老成分,但這種成分與東南亞的和平文化古老人羣並無明顯的直接聯繫,而且與新石器時代的西伯利亞和東亞南方地區的沿海人羣密切相關。這些研究表明,沿海區域不但未對相關人羣造成隔離,反而促進了人羣之間的互動和基因交流,即沿海地帶是亞洲人羣交流的重要通道。這一研究結果亦為探索東北亞祖先人羣的構成提供了新的研究思路和遺傳學線索。

  四、潛心專研,引領古DNA技術探索與跨學科研究的實踐典範

  該研究工作自2012年起籌備開展,歷經八年艱辛持續的科學探索、多學科協作及一系列現代科研手段的運用和創新,最終取得重大發現和突破成果。其實早在2014年,付巧妹團隊便已成功獲得北方山東和南方島嶼亮島的幾個關鍵樣本的基因組數據,對東亞南北方古人羣遺傳特點得出非常有價值的研究進展。但是,亮島作為島嶼的特殊地理位置讓付巧妹始終存疑:亮島個體能否代表典型南方人羣?他們與南方大陸人羣會否存在巨大差異?比如説翁奇人(Onge)是居住在印度安達曼羣島的現代人羣,卻由於地理的隔離性而屬於較為原始的支系,與印度半島大陸人羣差異很大。基於系統的研究設想與嚴謹的科研追求,付巧妹帶領團隊開始了長達六年的南方大陸樣品“攻堅戰”。

  中國南方大陸炎熱潮濕的氣候非常不利於化石的保存,因而南方的樣本材料不僅稀少,而且微生物DNA污染嚴重,其中的人類DNA被高度甚至完全降解。原本要從年代久遠的人類骨骼遺骸中提取到內源DNA已是不易,而南方樣本更是讓相關實驗和研究難上加難。近四年,付巧妹團隊全力專注於南方樣本的採集和古DNA實驗,其間與我國南方多家博物館及考古機構聯絡深度合作,也有因古DNA樣品難獲得而吃“閉門羹”,深入南方30多個遺址採集257例古代人類樣本,常常遇到樣本完全不含古DNA或是保存條件太差而無法提取的情況。儘管如此,他們並沒有放棄,而是不斷摸索更有效獲取古DNA,尤其是核基因組的實驗方法。

  終於經過多方努力和不懈探索,實驗室通過延展應用單鏈文庫製備技術,共同開發古DNA捕獲技術及短片段提取技術等,成功獲取南方福建及台灣海峽島嶼5個遺址18個距今8,400-4,200年的人類基因組數據,填補東亞南方大陸核基因組空白區域。其中距今8,400年的福建奇和洞個體基因組尤其具有極高研究價值,不僅揭示出南方大陸人羣與北方大陸人羣的遺傳聯繫,而且證實了南島語系人羣的中國南方起源。審稿專家對此高度評價道,“研究提供了非常珍貴的基因組數據,其代表的時間和區域是前所未有而又必不可少的。”

  值得一提的是,付巧妹實驗室所延展或創新的這些古DNA關鍵技術,有着非常重要的應用前景。如共同開發古DNA捕獲技術,實現從大量土壤微生物DNA裏“釣取”極其微量的內源DNA(曾成功捕獲僅佔0.03%的人類核DNA);參與的古DNA短片段提取技術,將非冰凍層人類古DNA 破譯的時間推進到40萬年前。這些技術極大擴展了可用於古DNA研究的樣本範圍,將有力推動人類學、進化遺傳學與羣體遺傳學等相關學科的發展。

  中國南北方人羣的古基因組研究,揭開人類演化史的冰山一角,同時也提出更多、更深層的追問,舊石器時代的中國南北方人羣有着怎樣的互動與交流?中國南北方人羣的遷移與農業技術的傳播與擴散有何關聯?……這些追問讓我們期待着新一輪中國史前人羣研究帶來新的解答。

  致謝:該項目在研究過程中得到福建博物院文物考古研究所、平潭國際南島語族研究院、福建龍巖及漳平市博物館、山東考古與文物研究院、吉林大學、山東大學、山東省博物館、北京大學、內蒙古文物與考古研究所、西北大學等多家單位的大力支持與幫助;且得到中國科學院、國家自然科學基金委、騰訊基金會與美國霍華德·休斯醫學研究院的資助。

論文鏈接:https://science.sciencemag.org/content/early/2020/05/14/science.aba0909?rss=1

圖1:研究樣本的地理、年代、遺傳信息。(A)地圖中標註了本研究樣本的地理位置,以秦嶺淮河為界劃分了東亞南北方,灰色背景反映了海拔高度。(B)研究樣本的測年信息,樣本來自三個時期:新石器時代早期(9,500-7,500 BP)新石器時代晚期(5,000-4,000 BP)以及歷史時期(300 BP)。東亞北方的樣本均來自新石器時代早期,而東亞南方的樣本涵蓋了三個時期。(C)主成分分析圖(PCA),現代東亞人羣以灰點表示,他們聚集構成三個方向:“東亞北方人羣”、“東亞南方人羣”、“青藏高原人羣”,不同人羣相關的語言信息已註明。圖中還包括不同時期、不同區域已發表的亞洲古代人羣: 1:“含古老亞洲成分人羣”; 2:來自東南亞和西南太平洋的與南島語系人羣祖先相關的島民;3:新石器時代、青銅時代和歷史時期的東南亞人羣; 4:新石器時代、青銅時代和歷史時期的青藏高原人羣; 5:古西伯利亞人(Kolyma)和新石器時代的西伯利亞人羣。(D)古代東亞人羣成對計算的outgroup-f3分析,黃色表示人羣之間遺傳相似度更高。

圖2:古代亞洲人羣之間的系統發育圖。(A)Treemix分析得到三次遷徙事件的最大似然性系統發育樹。(B)古代亞洲人羣之間的系統發育圖,實線表示分支,虛線表示混合事件並顯示了混合比例。(C)(D)現今東亞人羣與古代亞洲人羣的遺傳結構對比圖,在圖(B)的基礎上計算了更多人羣的遺傳成分組成,以不同顏色表示不同遺傳成分,以顏色佔比表示不同成分的混合比例。

圖3:表明現今東亞人羣混合有新石器時代早期的古南方人羣成分和古北方人羣成分情況。(A-C)新石器時代早期、新石器時代晚期及現今東亞和東南亞人羣與東亞南北方古人羣之間的遺傳關係圖,綠色表示與東亞古北方人羣關係更近,藍色表示與東亞古南方人羣關係更近。(D-F)亞洲的主要祖源人羣成分在歐亞不同時期人羣中的比例分佈圖,綠色代表東亞古北方人羣成分,藍色代表東亞古南方人羣成分,淺綠色表示古西伯利亞人成分,橙色表示東南亞和平文化人羣成分,淺藍色表示日本繩紋文化人羣成分。

圖4:(A)不同人羣的遺傳分化指數分佈圖,指數越高表示相關人羣的分化程度越高,遺傳差異越大,該圖表明新石器時代南北方人羣的的遺傳差異遠高於現今東亞南北方人羣。(B)現代漢族人羣祖源成分與地理分佈圖。現今中國南北方的漢族人羣,不管是在南方還是北方,均顯示混合有東亞古南方人羣成分、古北方人羣成分、古西伯利亞人成分。其中,現代漢族人羣裏攜有古北方人羣成分比例最高的羣體顯示位於山東,這裏也正是本研究古北方人羣的代表個體樣本的遺址所在地,由此反映出山東地區人羣自新石器時代以來的遺傳連續性。(C)現今東亞人羣與古南方人羣、北方達斡爾族人羣的遺傳關係圖,綠色表示與古南方人羣的關係更近,藍色表示與達斡爾族人羣更近。(D)古南方人羣與現今傣族人羣、台灣島阿美族人羣的遺傳關係的f4分析圖,Z>3 表示與阿美族人羣關係更近。

來源:中科院古脊椎動物與古人類研究所