Science封面6連發:人類最完整的基因組測序完成
全世界科學家近40年的努力,今天終于圓滿了!
Science連發6篇封面文章,宣布人類完整基因組測序計劃正式完成。
據路透社、Science等報道,這項成果填補了前人幾十年努力后仍然存在的空白,為全球 79 億人中尋找有關致病突變和遺傳變異的線索提供了新的希望。
算起來,距離人類最早討論基因組測序計劃,到今天已經過去了近40年。
19年前差8%「進度條」,現在終于填上了
1984年,由美國政府資助的旨在討論日益發展的DNA重組技術的會議上,科學家們第一次討論了人類基因組測序的價值。
1990年,人類基因組計劃由美國能源部和NIH投資,預期在15年內完成。
1999年,中國科學院遺傳研究所人類基因組中心向NIH國際人類基因組計劃(HGP)遞交加入申請,承擔總測序量1%(約3000萬對堿基)的測序任務。
2003年4月,人類基因組計劃宣布完成。但這里的「完成」要打個折扣,因為這個計劃無法對所有人類細胞中發現的DNA進行測序,只能對基因組的「真染色質」區域進行測序,這些區域占人類基因組的92%。
其余的8%,稱為「異染色質」區域,由高度重復且結構緊密的 DNA 塊組成,當時的測序技術無能為力。
現在,這部分之前難以讀取的堿基對,被一個名叫「端粒到端粒聯盟」(T2Tconsortium)的組織解決了。
最新一期 Science 以「填平鴻溝」(Filling the Gaps)為題報道了這一重磅消息,并刊載了關于新的測序技術細節的六篇論文。
這個名字就很有意思,端粒是是真核生物染色體末端的DNA重復序列,正處于典型的異染色體區域,即之前的無法完成測序的部分。
「T2T聯盟」在推特上宣布,這些部分的測序工作已經正式完成。
歐洲分子生物學實驗室副主任、原人類基因組計劃成員、生物信息學家Ewan Birney說:「我認為我們甚至在5年前都無法想象。
以前無法破譯的基因組序列現在已經清晰可見,其中包括端粒和中心粒的部分,后者位于每條染色體的中間,起協調復制的作用。
此外,還有五條染色體的短臂上的基因組完成測序。這些短臂已知包含幾十個編碼核糖體主干的基因,核糖體是細胞的「蛋白質工廠」。
全基因組測序變成「完形填空」
2001年,人類基因組的第一份草案提出開始時,甚至在首次宣布「完成」后,基因測序技術都無法涉足DNA序列包含非常重復的堿基段的區域。在測序結果中,這些重復序列一般被跳過留白,或者以錯誤的方式呈現。
隨著測序技術的提高和成本的下降,這些留白和錯誤的空間越來越小。2017年,科學家們發布了一個名為GRCh38的人類基因組。由于其「留白」缺口不到1000個,在許多人看來,它成為了其他人類基因組的標桿參照。
從那時開始,科學家們開始把這個工作做成了「完形填空」。
越來越多的人加入,想把這個完形填空繼續做到底。
2019年,美國國家人類基因組研究中心的生物信息學家Adam Phillippy報告說,已經成功地對X染色體進行了從頭到尾的測序,這也激發了其他幾十個研究人員加入這一事業。
「這項事業真的有了自己的生命,」加州大學圣克魯茲分校的遺傳學家Karen Miga表示。在一次會議上和Adam Phillippy見面后,他們開始攜手合作。
T2T結合了多種測序技術,其中有納米孔設備,可以同時識別100000對堿基;還有另一種測序設備,結果更精確,但是同時只能識別10000對。研究人員對后一種辦法做了一些升級,進一步提高了準確性。
Waterston表示,「看看他們為了解決這些問題用了多少方法,你就知道到底有多難了。」他是華盛頓大學的一名遺傳學家,曾經一同領導過人類基因組計劃。
最終,大概兩億對堿基排列順序正確、位置正確。其中包括超過1900組基因,大部分都是已知基因的復制。研究人員將復制的區域和可移動的元素進行記錄——比如病毒帶來的基因材料被整合到了基因里。
短染色體臂(short chromosome arm)蘊藏著另一個驚喜。就像預料的一樣,這些短染色體包含很多復制,總共有400個,復制的是為RNA編碼的基因。
Miga表示,「rDNA是最后一塊多米諾骨牌。」,這部分一直以來都是最難測序的地方。
「這真的很神奇,人類的基因組竟是這么的動態。」人類基因組計劃組織者之一George Church教授表示。
這次測的是誰的DNA?
如此完整的基因測序工作,自然離不開無私奉獻的人貢獻出自己的DNA。51歲的哈佛生物學博士Leonoid Peshkin就是這樣一個人。
此次測序基因組的Y染色體來自Peshkin,而剩下的DNA則來自所謂的葡萄糖妊娠(molar pregnancy),這是一種較為罕見的子宮生長方式。精子在進入卵細胞時如果沒有染色體,就會發生葡萄糖妊娠。
在這種情況下,受精的細胞會復制精子的23條染色體,產生兩組一模一樣的染色體, 并具備復制能力。匹茲堡大學的遺傳學家Urvashi Surti發現了這個特性可以對基因組測序工作大有幫助,因為測序儀不必解決父母染色體之間的差異。她想據此培育一個細胞系出來。
在征得了醫療中心審查委員會的許可后,她刪掉了所有有可能會和父母有關聯的信息。2001年,她成功了,并獲得了1981到2000年間相關研究的數據。
2019年,該研究出現了一些潛在的問題,當時美國國家人類基因組研究所(NHGRI)要求任何基因數據共享,都必須征得捐獻者百分之百的同意。
雖然Surti和她的團隊沒有獲得相應的許可,但NHGRI最終對這項研究網開一面。他們認為,這次例外應該要開個后門,因為該研究的大部分序列都已經公開了。
然而問題還是沒有得到解決。研究中創造的基因組的主人身份究竟能不能靠數據庫確認?
NHGRI認為,就算能確認,也不能這么做。這樣做是不道德的。男方身份也不能公開,哪怕是去找他要許可也不行。
Surti研究中的基因組只有X染色體,沒有Y染色體,最后,Peshkin的DNA被加了進去。此前,Peshkin和他的父母曾經為DNA研究捐獻過組織。
幾個月前,Peshkin給NIST打了個電話。NIST告訴他,T2T研究團隊正全面的對Peshkin的X、Y染色體測序。正是因為他的奉獻,研究人員才得以大規模的利用他的DNA。他的基因組將會是有史以來第一個完整的人類基因組。
Peshkin表示,「我非常興奮能參與到這項前沿的科學研究中來。為科學做點微不足道的貢獻嘛,這是我該做的。」
參考資料:
https://www.science.org/content/article/most-complete-human-genome-yet-reveals-previously-indecipherable-dna
https://www.science.org/toc/science/376/6588
https://www.reuters.com/lifestyle/science/scientists-publish-first-complete-human-genome-2022-03-31/
本文來自微信公眾號“新智元”(ID:AI_era),編輯:拉燕 David,新智元報道,36氪經授權發布。
標簽: