憑基因組數據識別人臉,不靠譜!
――著名生物學家文特爾最新研究遭質疑
能否根據基因組預測人類相貌引發業界專家激烈爭論。圖片來源:nature網站
本報記者 聶翠蓉 綜合外電
今日視點
克萊格・文特爾是美國頗有影響力的生物學家,雖説不是畢業於所謂的名牌大學,但他的每一次研究舉動,總會在業界帶來颶風般的影響。比如他曾成立公司公然挑戰30億美元人類基因組計劃,宣稱會用3.3億美元搶先一步公佈人類基因組圖譜,迫使人類基因組計劃提前2年完成;他的研究團隊在實驗室製造出世界首個人造生命……
近日,文特爾創辦的一家公司宣佈,他們的新研究認為,DNA數據會通過相貌和身體特徵泄露匿名者的真實身份,再次引來其他科學家們的質疑和批評。
據《自然》雜誌網站近日報道,他創辦的人類長壽公司(HLI)的科研團隊在《美國科學院學報》發表論文建議,法律制定機構、科學家和其他相關人員,應加強對人類基因組數據的監管,防止因DNA數據外泄而暴露個人隱私。
但來自賓夕法尼亞大學和哥倫比亞大學等機構的知名科學家卻質疑稱,文特爾團隊的研究誇大了基因識別人們身份的能力,會引起社會對基因隱私的不必要的恐慌。更有參與研究的內部人士表示,文特爾此舉存在私人目的,他可能在利用自己的影響力,改變目前基因數據公開獲取的現狀,利用自己的基因數據庫謀取利益。
研究結論或過度誇大
文特爾團隊發表論文稱,他們對不同年齡和種族背景的1061位志願者進行了全基因組測序,結合對這些參與者面部拍攝的高清晰度3D照片,他們開發出的人工智能軟件能基於DNA序列的SNPs(單核苷酸多態性)識別出臉頰骨高度等面部特徵,並發現一個人SNPs隱含着其身高、體重、年齡、口音和膚色等個性化特徵。結果證明,利用他們的方法和HLI的DNA數據庫,從隨機選出的10個人中識別出某個人的準確率高達74%。
在仔細研讀文特爾團隊的論文後,許多遺傳學家提出了質疑,認為研究結論存在誇大事實嫌疑。賓夕法尼亞大學人類學家馬克・施萊弗認為,這篇論文並沒有證明僅靠DNA數據就能準確辨別某個人的隱私,因此文中提出的風險並不存在,而且自由選擇10個人,規模這麼小的樣本,依靠年齡、性別和種族這些數據就可以完全將這些人區別開來,根本不需動用DNA數據。
為進行有力反駁,哥倫比亞大學計算機生物學家雅尼夫・埃裏希重新對論文中提到的年齡、性別和種族數據進行了模擬研究,並在預印本網站BioRxiv發表了研究結果,不必知道這些人的任何基因組信息,僅依靠這3個特徵就足以將某個人從10人中區別出來,準確率高達75%。他還推斷,HLI利用SNPs數據重構的面部特徵並不能準確指向某個人,只是與性別和種族等特徵的某類人接近而已。
《科學》雜誌曾拒發論文
施萊弗稱,論文發表在《美國科學院學報》之前,文特爾團隊曾將論文提交給《科學》雜誌,他當時參與這篇論文的同行審議。當時評審團認為,雖然HLI的研究數據真實可靠,研究中通過對染色體兩端進行測序來推斷測試者年齡的全新方法令人印象深刻,但論文並沒有像聲稱的那樣能通過DNA數據精準識別個人信息,研究結論存在故意歪曲傾向。
雖然論文署名作者中包括文特爾等重量級人物,但《科學》雜誌最終還是拒絕發表該論文。根據規定,作為美國科學院院士,文特爾有權自己選擇3位科學家對其論文進行同行審議,通過後即可在《美國科學院學報》發表。《美國科學院學報》承認是文特爾自己選擇了兩位信息隱私方面的專家和一位生物倫理學家,評審通過了該論文。
HLI拒絕對論文評審過程進行評論,只是在一份聲明中表示,雖然設置的研究樣本規模過小,但研究中的方法學完全沒有問題,基於一千個左右參與者的基因組數據庫,精準識別一個人完全可能做到,並且這種識別將會越來越準。
強調基因組隱私或為經濟目的
論文作者之一、現在蘋果公司工作的計算機生物學家傑森・派珀承認,由於他已經跟HLI簽訂同意書,放棄論文發表前簽名同意的權利,從而讓HLI按照公司意願對實驗數據進行陳述,論文歪曲了他和其他同事的研究結果。
派珀通過推特對論文進行了嚴厲批評,認為HLI這樣做存在利益考量。由於現行制度規定,所有用於研究的遺傳學數據必須能公開獲取,但作為盈利為目的的公司,HLI希望能建造世界上最大的人類遺傳信息數據庫,並以保護個人隱私為藉口,遊説政策制定部門對DNA數據庫設置各種限制條件,將這些數據作為公司賺錢的工具。“保護遺傳隱私非常重要,但為獲悉更多的基因組信息,人們必須共享所有相關數據,為這種共享設置障礙的方法是背道而馳的。”派珀説。
雖然HLI一再聲明主張保護基因組信息的目的是促進數據交換的安全性,但埃裏希認為,以文特爾的地位,這次的論文必將吸引更多政策制定者的關注,在決策中參考這類研究論文,制定出全新管理制度,阻礙人們在研究中共享基因組數據。