“運用傳統(tǒng)的序列信息,人類對m6A修飾的預(yù)測準(zhǔn)確率只能達到80%;在此基礎(chǔ)上我們加入了35種其他組學(xué)信息,使準(zhǔn)確率一下子提升到90%。”
近期,由西交利物浦大學(xué)生物科學(xué)系孟佳博士帶領(lǐng)的科研團隊,實現(xiàn)了對全轉(zhuǎn)錄組RNA分子m6A修飾的最精準(zhǔn)預(yù)測,相當(dāng)于為人類繪制了迄今為止最精準(zhǔn)的m6A觀轉(zhuǎn)錄修飾地圖。其研究成果已發(fā)表于生物信息領(lǐng)域的一流期刊《核酸研究》(影響因子:11.561)。
該團隊對m6A修飾出現(xiàn)在基因的位置做出預(yù)測,并盡最大可能提升預(yù)測的精準(zhǔn)度。
m6A修飾屬于“RNA修飾”的一種。“RNA修飾”指的是發(fā)生在RNA分子上的生物化學(xué)修飾,可以在不改變RNA分子序列信息的情況下改變其特性,并調(diào)控基因信息的表達。
RNA修飾是個內(nèi)容及其豐富的研究領(lǐng)域,為當(dāng)前生物科學(xué)領(lǐng)域的熱點內(nèi)容之一。“目前已知的RNA修飾有100多種,其中m6A是含量最高的一種,可能也是最重要、最具有研究價值的一種。”孟佳博士解釋道。
“過去的研究只考慮序列信息,預(yù)測的準(zhǔn)確率是80%。序列信息是生物信息里最重要的,這點我們不否認,但還有其他信息也是有價值的。”孟佳博士說。
在RNA修飾領(lǐng)域,西浦是第一個應(yīng)用35種組學(xué)信息進行預(yù)測的科研團隊。“通過該方法將預(yù)測準(zhǔn)確性提升到90%,這是一個比較大的突破。該工作為RNA修飾領(lǐng)域的研究工作提供了更為可靠的參考信息。”孟佳博士補充道。
在繪制m6A表觀轉(zhuǎn)錄組地圖的過程中,該團隊運用機器學(xué)習(xí)的技術(shù),通過已有的特征,訓(xùn)練出預(yù)測模型,預(yù)測基因的哪些位置可能與RNA修飾相關(guān)。
“最大的難點是如何構(gòu)建和選擇用于機器學(xué)習(xí)的特征,”論文第一作者之一、博士生魏震介紹道,“這些特征是我們自己構(gòu)建的。這是研究過程最基礎(chǔ)最困難的部分,但也是我們能夠取得突破的關(guān)鍵。”
“實現(xiàn)精準(zhǔn)預(yù)測并了解了基因RNA修飾的位點之后,接下來就能更容易知道哪些酶會參與到這個過程中來,對進一步研究基因的功能、性狀及其與人類某些疾病的關(guān)系會有一定的價值。”論文第一作者之一、博士生陳鯤淇補充道。
發(fā)表于《核酸研究》上的這篇論文有四位共同第一作者,他們均為西浦生物科學(xué)系學(xué)生,包括博士生陳鯤淇、博士生魏震、本科畢業(yè)生張晴和博士生吳翔宇。該團隊的指導(dǎo)老師包括生物科學(xué)系的孟佳博士、呂志良教授、榮榮博士以及數(shù)學(xué)科學(xué)系的蘇炯龍博士。孟佳博士為論文的通訊作者。
早在2012年,孟佳博士在美國麻省理工學(xué)院從事生物信息分析研究時就開始專注于RNA修飾領(lǐng)域的研究。他于2013年回國加入西交利物浦大學(xué),近年來其關(guān)于RNA修飾的研究項目獲得了包括國家自然科學(xué)基金在內(nèi)的多個科研基金項目的支持。(通訊員:石露蕓 陳炳宇 寇博 田麗萍)