您的位置:首頁 > 資訊 > 科技 >
基因組測序“黑科技”,加速生命數字化的進程
來源:科技日報 2019-06-25 13:37:36

“測序技術抓住了生命科學技術的龍頭,基因組測序成本從最初的3000萬美元下降到1000美元甚至更低,使得每個人都可能為自己進行基因組測序,這將加速生命數字化的進程。”6月21日,2019測序技術和應用高峰論壇上,中國科學院院士楊煥明表示,在高通量測序技術自主化的基礎上,不斷有新的“黑科技”跟進,這使得人們將獲得更加準確的基因序列,作為生命數字化的“藍本”。

吐口唾液就能測序,但基因組序列不完整

吐口唾液郵寄,一個人的基因組序列就會得到分析。

“目前從全世界范圍來講,大概有接近2000萬人有自己的基因信息。”華大智造首席運營官蔣慧表示,隨著這些年測序技術的普及,測序的門檻越來越低,人們越來越容易對自己的基因進行部分測序。

但并不是所有的測序都是獲得完整的基因組序列。蔣慧介紹,大部分此類的測序是對特定區域的測序,而并不是整個基因組序列的測序。

如果將一個人的基因組比喻成一座奇峰險峻的高山,可以理解為,有些測序只是拍攝了“一線天”“巨石陣”“黑龍潭”這些有代表性的景點;更完整地是,有些測序是把所有的景點拍下來,被稱為“功能基因集”;而完整的基因組測序才是把高山全部拍下來,包括像荒草一樣叢生的“沙漠基因”或者“無功能基因”等。

無疑,要實現生命數字化,需要的是把高山全部拍下來的完整的基因組測序。

但目前的測序,即便是基因組測序,仍舊不能滿足生命數字化的需要。“目前無論是數據庫構建,還是群體研究、疾病研究,都是采用重測序的方式,是通過與參考基因組的比對獲得的,而不是從頭組裝。”蔣慧說,比如在炎黃基因組研究項目中,科學家找到了大概有4—5兆的區域是個體所特有的,進行測序時就對個體區域比對,形成測序數據,這是受測序效率制約的。

可以理解為,每一座高山的形狀、代表性景點都相似,就先找了最具代表性的山做個詳細的“數字化解讀”,描述其他山的時候,就用差異來體現。

“或許每個人擁有屬于自己的特點序列,但目前的測序方式難以發現這些獨特部分。”蔣慧說,與參考基因組比較獲得的基因組測序“密碼”不會對這些未知謎題給出答案。

從頭組裝,完成整個基因鏈條的拼接

數字化生命實際上需要一個高清、完整的基因組作為“藍本”。這意味著需要高質量地從頭組裝基因組。

“目前最大的難點是獲得盡可能長的序列進行組裝。”蔣慧說。如果單次測序讀長變長,那么獲得從頭組裝基因組的難度就會降低。

人類基因組長度為30億個堿基對,而現在單次測序的讀長僅為50—70kb(5萬到7萬個堿基對的長度),這猶如拼一副45000塊拼圖,其中卻有很多重復相似的“小塊”,很難拼接完整。不僅需要以參考基因組做對比,還要反復測序。“目前的行業標準是需要30倍的重復測序,以完成整個基因鏈條的拼接。”蔣慧說。

如果將短片段加上標簽就不一樣了。玩過拼圖的人都知道,在成千塊的拼圖背面會有不同的區塊標記,提示這些塊在同一區域。

“以專有DNA分子共標簽技術為基礎的stLFR(單管長片段)技術就是基于這樣的原理。”蔣慧說,華大智造的這一自主技術通過將來源于同一DNA長片段的短讀長測序片段標記上相同分子標簽,能夠基于高精度短讀長測序獲取長片段的DNA信息。

讀長是為了確定他山之石的位置,如果標簽可以解決定位問題,將彌補短讀長的弱點。基于此,從頭組裝兩條染色體,獲取二倍體測序數據也成為可能。

與此同時,華大智造將執行能得到從頭測序基因組的“676”標準。基于這些數據,可以檢測所有類型的結構變異,且無需與參考基因組進行比對,將大大提高基因組數據的參考性,最終幫助個體進行復雜疾病的診斷和預測。

蔣慧介紹:“我們首先會用新的技術、新的標準在全球完成1000個人的基因組測序,希望可以建出來一個模板讓大家先試用一下,以在不同人群中創建高質量的參考基因組和更為完整的人類基因組多樣性數據庫,構建一個全新的數據集。這些數據將免費向研究人員開放。”

解讀生命,別忘了體內的微生物

2018年,《自然》發表了一篇“為了生孩子把貓狗扔掉”的報道,成為科普文章的爆款。文中顯示,加拿大科學家研究了770個嬰兒的腸道菌群,發現家中有寵物的嬰兒,其腸道菌群多樣性明顯高于家中沒有寵物的嬰兒;瑞典調研100多萬兒童發現,與狗狗生活在一起的小孩子得哮喘病的風險能降低13%。

人體是一個龐大的共生體。人體皮膚表面、口腔、呼吸道、腸道生存著大量微生物,它們的數量是人體本身細胞的數十倍,編碼的基因是人體基因的100倍。每個人的經歷會以微生物的痕跡留在身體里,而人體的健康會與體內的菌群休戚與共。人們將特定環境中包括微生物在內的總DNA稱為宏基因組。

數字化生命中,人體與微生物的作用和關聯如果得到客觀地反映,甚至可能反映生命的進程。例如,老年人腸道內變形菌門、黏膠球形菌門、擬桿菌屬等含量會降低。“為此,我們在與瑞典卡洛林斯卡醫學院的微生物轉化醫學研究中心做了一個合作,啟動了萬人微生物研究項目,將對一萬人的宏基因組進行測序。”蔣慧說,“微生物是人體內另外一套基因組,除開自己的基因組之外,我們的身體就像一個小社會,大家平時和環境做一些接觸、吃的各種東西,人體內的病原或者微生物都會反映出來。”

依據計劃,萬人宏基因組測序將在3個月內完成。卡洛林斯卡醫學院之前已經收集了大量的樣本,華大智造將負責完成數據產出,以及產出后的數據分析和疾病關聯的工作。

DNA是本源,但還需其他參數

未來,數字化生命還有很多基礎性工作要做,比如要了解基因和表型是什么關系,構建模型以研究生活習慣、疾病與特定基因表達的相互關系……

但歸根結底,遺傳性的DNA信息是不會再改變的,它不像其他一些因素,比如人體內的一些微生物會隨著環境、飲食發生一些變化。最源頭的遺傳,來自于父親和母親的基因組不會再變化,是一個本源核心的東西。“華大集團有一個非常宏大的計劃叫做8B(80億人的高清基因測序),我們希望在未來通過努力讓每個人都有自己的基因組數據。”蔣慧說。

“這些需要一步一步去實現,DNA是本源、是核心,但我們還會有很多其他的生命數據,包括蛋白、代謝等。”蔣慧說,除了基因組數據,還可以加入很多現有的醫學資料,例如體檢時的血液常規性篩查,可穿戴設備上的數據等,把這些所有的數據收集起來,逐步完成生命數字化的過程。(張佳星)

相關文章
全球首臺蘭博基尼SUV上路百公里加速3.6秒 或售130萬

全球首臺蘭博基尼SUV上路百公里加速3.6秒 或售130萬

近日,蘭博基尼汽車有限公司宣布Urus車型在國內正式上市,該車型搭載了4 0L V8雙渦輪增壓發動機,使其0-100km h加速時間僅需3 6s,而最高更多

2018-01-08 15:23:45