上海高校建立全球最大蛋白質(zhì)序列數(shù)據(jù)集
中新社上海3月22日電 (記者 許婧 鄭瑩瑩)上海交通大學(xué)洪亮教授團隊22日發(fā)布其最新成果:建立了全球最大的蛋白質(zhì)序列數(shù)據(jù)集,并利用其訓(xùn)練了Venus(啟明星)系列模型。
肉、蛋、奶,這些食物中含有豐富的蛋白質(zhì),可以提供人類身體所需營養(yǎng)。但天然的蛋白質(zhì)難以發(fā)揮這些功能,科研人員需要對天然蛋白質(zhì)的功能進(jìn)行設(shè)計和改造,才能使它成為滿足應(yīng)用需求的產(chǎn)品。長期以來,蛋白質(zhì)設(shè)計改造一直面臨時間長、成本高等難題。
據(jù)介紹,洪亮團隊建立了全球最大的蛋白質(zhì)序列數(shù)據(jù)集,包含36.2億條陸地微生物蛋白質(zhì)序列、26.4億條海洋微生物蛋白質(zhì)序列、24.3億條抗體蛋白質(zhì)序列,以及0.6億條病毒蛋白質(zhì)序列。
研究團隊表示,基于該數(shù)據(jù)集訓(xùn)練的模型,可以把蛋白質(zhì)生產(chǎn)從“緩慢的試錯”變?yōu)椤案咝实木珳?zhǔn)設(shè)計”。
研究團隊基于該數(shù)據(jù)集訓(xùn)練了Venus系列模型,該系列模型有“AI定向進(jìn)化”與“AI挖酶”兩大核心功能。
“AI定向進(jìn)化”指 Venus系列模型可以對一個不盡如人意的蛋白質(zhì)產(chǎn)品的多種性能進(jìn)行優(yōu)化。
“AI挖酶”則指 Venus系列模型基于該數(shù)據(jù)集可精準(zhǔn)找到具備超常規(guī)功能的蛋白質(zhì),比如極度耐熱、耐酸、耐堿、耐胃腸消化的蛋白質(zhì)等。而這些超常規(guī)功能的蛋白質(zhì)在生物技術(shù)、醫(yī)藥研發(fā)和工業(yè)生產(chǎn)中具有可觀的應(yīng)用潛力。(完)


社會新聞精選:
- 2025年03月26日 09:33:43
- 2025年03月26日 08:20:23
- 2025年03月26日 00:29:47
- 2025年03月26日 00:06:13
- 2025年03月26日 00:05:21