首頁 > 風控 > 正文

AI蛋白質生成大模型亮相2023世界人工智能大會

2023-07-07 19:55:02來源:經濟參考網  


(資料圖)

業界首個AI蛋白質生成大模型“達爾文”(NewOrigin)7日在2023世界人工智能大會(WAIC)上正式亮相。其研發領軍人,清華大學智能產業研究院卓越訪問教授、分子之心創始人許錦波表示,AI蛋白質生成大模型瞄準創新藥設計、合成生物學等真實產業應用需求,將用一個模型滿足蛋白質生成全流程需求,未來大分子藥、新生物材料等蛋白質設計可實現“一鍵定制”。

據介紹,該大模型通過學習千億級多模態大數據,可實現多模態定向生成,單模型就能滿足序列生成、結構預測、功能預測、從頭設計等蛋白質生成全流程需求,解決產業應用所需的特定功能蛋白質生成難題,并在真實的產業環境中評估效果與價值。

過去60多年中,蛋白質結構始終是困擾生物學家的難題之一,這一局面在AI方法應用之后得到了根本性的改變。2016年,許錦波首次借助AI大幅提升了蛋白質結構預測精度,并開始逐步影響蛋白質生成。但由于極高的技術壁壘,蛋白質生成至今仍是尚未完全攻克的技術難題。

“大模型的出現將大大加速蛋白質生成技術的發展進程,并推動其在生物醫藥、合成生物學等領域應用。”許錦波表示。當下ChatGPT等自然語言大模型的表現,讓各界對大模型機制信心倍增。但在蛋白質生成等專業垂直領域,通用的自然語言大模型能力十分有限。究其原因,生物領域的復雜數據、專業知識與應用場景,都與自然語言交互的通用場景相差甚遠,能力要求也更高。

因此,研發蛋白質生成大模型,除了必備的算法、算力、數據等基礎條件,還需要具備兩大專業進階能力:一是融合計算機、生物、物理等多學科,熟識AI、分子動力學、量子計算等多種方法,且能在實踐中并行考慮序列與結構、主鏈與側鏈、進化與組學的跨領域融合能力;二是走出實驗室,下沉至真實的產業環境,在需求、驗證、落地上貼近真實產業需求的能力。

據了解,許錦波團隊從2019年開始使用預訓練機制研發蛋白質設計算法,通過整合結構預測、側鏈預測、蛋白-蛋白對接等多種技術,結合多種場景需求,目前已在改造或從頭設計蛋白質上取得了重要的突破。比如,設計功能類似但更小的蛋白質、能夠結合某個小分子的蛋白質、能夠結合某個底物的酶、基因編輯用的蛋白質等。

在此基礎上,許錦波團隊開發了融合自然語言和蛋白語言的AI蛋白質生成大模型“達爾文”(NewOrigin)。它具備可以根據特定需求定制化生成蛋白質、實現快速驗證和迭代、降低交互門檻等優勢。更重要的是,該大模型是真正面向產業需求的AI蛋白大模型,可基于工業級的應用反饋持續迭代,解決真實的產業需求。

為了更好地滿足應用所需,分子之心以大模型為底層基礎,面向藥物設計、合成生物學等應用場景打造產業級的解決方案,并進一步將大模型的能力在藥物設計、生物育種、環境保護、高性能材料等多個領域廣泛落地,驅動多領域創新。比如,以對話交互的方式,讓NewOrigin生成針對某個靶點的抗體,或生成具備某個底物特異性的酶等。

許錦波表示,AI和生物科技是當下全球科技競爭的重要戰略領域,蛋白質技術作為生物科技的底層技術,與AI融合創新是必由之路。AI蛋白質生成大模型的開發只是起點,更具價值的是將其真正應用于產業中,實現可編程、可預測的創新藥設計和生物制品開發,通過底層技術突破驅動生物經濟變革。(記者 李志勇)

關鍵詞:

責任編輯:hnmd003

相關閱讀

推薦閱讀