來源:美股研究社 時間:2020-03-13
3月13日,阿里云對外宣布,將向全球醫(yī)療科研機構(gòu)、疾控中心等一線病毒研究機構(gòu)免費開放云上病毒比對服務(wù),可大幅提升病毒基因檢測效率,最快只需60秒即可完成包括新冠病毒在內(nèi)的任意病毒基因?qū)Ρ裙ぷ鳎瑢M一步了解病毒變異提供有效依據(jù)。這是繼此前宣布AI算力免費后,阿里云再次用技術(shù)“搶奪”寶貴時間。
病毒經(jīng)過數(shù)代傳播,會產(chǎn)生變異,追蹤掌握病毒變異情況成為科研人員的重中之重。宏基因組測序mNGS是目前較為有效的追蹤方案,配合病毒庫可精準確定病毒的代際關(guān)系,甚至找到病毒源發(fā)地。
但此前的mNGS數(shù)據(jù)分析較為耗時,以某新冠重癥患者為例,系統(tǒng)需要對2200萬個序列超過32億個堿基一一和病毒庫比對,檢測出新冠病毒特征區(qū)域的完全匹配系列,通常這一過程需要30分鐘或更久。
此次阿里云免費開放的基因計算服務(wù)AGS(Alibaba Genomics Service),采用容器技術(shù)和GPU,即開即用,可同時運行多個病毒基因比對服務(wù),大大縮短了這一進程,60秒內(nèi)即可獲取高質(zhì)量的基因比對報告,為患者提供更為準確的醫(yī)療方案。
包括疾控中心、各大高校、醫(yī)院、基因企業(yè)等一線病毒研究機構(gòu)可在阿里云上申請快速開通基因計算服務(wù),為進一步研究病毒蛋白質(zhì)及變異提供準確的數(shù)據(jù)支撐。
目前,國內(nèi)基因公司安諾優(yōu)達已開始借助阿里云的計算能力從某腫瘤樣本數(shù)據(jù)中尋找病毒相關(guān)序列的數(shù)據(jù),用于研究病毒活動與某腫瘤發(fā)生的相關(guān)性。
研究冠狀病毒基因序列到底有什么用?
SARS-CoV-2病原體基因組的隨機突變可以幫助研究人員跟蹤COVID-19的傳播和傳播。
幾年前,瑞士巴塞爾大學(University of Basel)的進化生物學家Richard Neher和他的同事想要監(jiān)測流感基因構(gòu)成的變化,看看這些數(shù)據(jù)能否幫助科學家研制出更有效的流感疫苗。于是他們開發(fā)了一個在線界面,集成了最新的病毒排序數(shù)據(jù),并對其進行分析,然后將結(jié)果發(fā)布在一個可公開使用的交互式網(wǎng)絡(luò)瀏覽器中。
"然后我們就在想,為什么只關(guān)注流感,而不關(guān)注其他病毒呢?"Neher說。于是該團隊建立了一個類似的平臺來記錄MERS和埃博拉病毒的傳播情況,并將其命名為NextStrain.org。現(xiàn)在,隨著SARS-CoV-2在全球范圍內(nèi)傳播,他們已經(jīng)對網(wǎng)站進行了調(diào)整,以跟蹤其基因變化,并在世界地圖上繪制病毒譜系,以便在病毒從中國的主要熱點轉(zhuǎn)移到其他國家的小區(qū)域時,幾乎實時地觀察病毒。
從受感染病人身上提取的病毒基因組序列如何幫助科學家建立病毒的家譜?
這些冠狀病毒傾向于改變它們的基因組,它們以相當高的速率變異。這些突變使科學家能夠把病毒分成關(guān)系更密切的病毒和關(guān)系不那么密切的病毒。網(wǎng)站上的所有序列都超級相似,因為它們關(guān)系密切。隨著時間的推移,不同病毒獲得了獨立的突變,然后它們在世界的不同地方引起暴發(fā)。你可以通過基因組成將這些序列組合在一起,重建病毒的傳播樹。
能從樹上估計感染的數(shù)量嗎?
如果觀察病毒樹就會看到不同的序列。這棵樹會有不同的形狀,這取決于它是保持原來的大小還是在生長。如果它在生長,你會看到很多很多的血統(tǒng)在樹的深處聚在一起,這就是現(xiàn)在看到的。這意味著在樹的底部有快速的擴張,將所有的血統(tǒng)分開。你可以估計擴張的速度,如果你知道爆發(fā)的時間,你還可以估計感染的數(shù)量。
使用這種方法能得到什么樣的估計?
現(xiàn)在很難解釋來自中國的數(shù)據(jù)。動態(tài)正在改變,而病例數(shù)正在趨于穩(wěn)定。科學家們預(yù)計這是中國對5億人采取的嚴厲控制措施或隔離措施的結(jié)果。報告的病例有8萬,所以感染人數(shù)可能是20萬,可能是50萬。我們不知道,因為人們可能在家里生病,呆在家里,因為醫(yī)院太擁擠,你可能會在那里感染。因此可能有很多病例根本沒有被統(tǒng)計。
關(guān)于病毒的起源,這些數(shù)據(jù)能告訴我們什么?
第一個結(jié)論是所有這些序列都非常非常相似,大約有8個不同的突變。這是3萬個堿基序列中的8個突變。這告訴我們,病毒來自一個來源,就在不久之前,大約在11月中旬到12月初之間。
突變數(shù)據(jù)能告訴我們病毒是否變得更加致命嗎?
科學家們可以看到突變在哪里改變密碼子,在哪里改變氨基酸。大多數(shù)的突變可能是完全無關(guān)緊要的。他們只是發(fā)生;每個月大約有一個突變。但他們正在關(guān)注可能產(chǎn)生影響的突變。
病毒譜系如何幫助科學家們追蹤疾病的傳播?
突變將類似的信息聚集在一起。所以,攜帶病毒的家庭傾向于共享一個相似的病毒突變,因為他們有相同的病毒。它們是一個傳輸集群。所以你可以觀察這些集群,看看它們在世界各地的分布,并繪制出它們的分布圖。如果你在一個新的區(qū)域,比如病毒傳播的意大利,對病毒基因組進行排序,它們都是同一個病毒群的一部分,那么我們就有理由相信,該區(qū)域有一個病毒的引入。但如果病毒基因組來自不同的簇,那就意味著有大量的播種事件,然后在那里形成小簇。
NextStrain能否揭示任何關(guān)于疫情嚴重程度的信息,以及疫情是否會演變成大流行?
它并沒有給我們關(guān)于疫情嚴重程度的信息。它確實告訴我們不同的疫情是如何聚集在一起的,以及當?shù)氐囊咔槭侨绾尾煌?。因此,毫無疑問,它將成為一種流行病。(文章來源:美股研究社)