這個名為“通用表達轉換器”(GET)的模型由美國哥倫比亞大學和卡內基-梅隆大學等機構研究人員聯(lián)合開發(fā),其準確性和有效性已得到實驗驗證,論文發(fā)表在新一期英國《自然》雜志上。
在基因表達過程中,以DNA形式儲存的基因“藍圖”轉錄成為RNA形式的“抄本”,后者指導合成出蛋白質,執(zhí)行具體的生理功能。參與轉錄調控的生物分子種類繁多,相互作用極為復雜,此前相關預測模型局限于幾種特定的細胞,尤其是癌細胞,缺乏適用于人體多種細胞類型的通用工具。
研究人員根據轉錄調控機制的特點設計出機器學習模型,然后用來自1.3萬個人體細胞的基因測序和表達數(shù)據對其進行訓練。這些細胞涵蓋213種人類胚胎細胞和成體細胞,都來自沒有病變的正常人體組織。
就像ChatGPT等人工智能工具能根據大量語料總結出通用語法規(guī)則,GET模型也能從訓練數(shù)據中總結出關于轉錄調控的“語法”,在此基礎上能對其沒有接觸過的細胞類型進行基因表達預測。
該模型可用于揭示致病基因的作用機制,指導癌癥和遺傳疾病研究。例如某種兒童白血病的患者攜帶一個功能不明的變異基因,GET模型預測該基因會擾亂細胞中兩種轉錄因子的相互作用,實驗數(shù)據證實了這一結論。
研究人員說,該模型還可用于探尋基因組中“暗物質”的作用。蛋白質編碼基因序列只占人類基因組的一小部分,占比達98%的非編碼區(qū)域就像宇宙中的暗物質一樣,其屬性和功能目前難以捉摸。
關鍵詞:
凡注有"環(huán)球傳媒網"或電頭為"環(huán)球傳媒網"的稿件,均為環(huán)球傳媒網獨家版權所有,未經許可不得轉載或鏡像;授權轉載必須注明來源為"環(huán)球傳媒網",并保留"環(huán)球傳媒網"的電頭。
資訊
- 鄧州市法院開展防范非法金融法治宣傳活動
- 瓊瑤兒子維權:嚴正聲明叫停冒名演出
- 內鄉(xiāng)縣赤眉鎮(zhèn):持續(xù)優(yōu)化營商環(huán)境 穩(wěn)步推動經濟發(fā)展
- 向“新”而行 制造業(yè)轉型升級步伐加快
- ?西平縣盆堯鎮(zhèn)建立“公益紅娘服務”線上平臺助力移風易俗新風尚
- 2024年前11個月支持科技創(chuàng)新和制造業(yè)減稅近2.3萬億元
- 兩部門:2025—2027年年均新增2億千瓦以上新能源的合理消納利用
- 山西核桃產品走向國際市場 出口75個國家和地區(qū)
- 2024年12月我國倉儲行業(yè)整體保持良好運行態(tài)勢
- 夜校“充電”成新潮流 今年江西4.2萬余青年解鎖新“夜”態(tài)