仪器网(yiqi.com)欢迎您!

| 注册2 登录
网站首页-资讯-专题- 微头条-话题-产品- 品牌库-搜索-供应商- 展会-招标-采购- 社区-知识-技术-资料库-方案-产品库- 视频

资讯中心

当前位置:仪器网>资讯中心> 正文

生物界的ChatGPT:ProGen——开启人工智能设计蛋白质的新时代

来源:翌圣生物科技(上海)股份有限公司 更新时间:2023-02-21 00:00:00 阅读量:56
导读:翌圣ZymeEditor平台是翌圣生物酶进化研发中心六大核心技术平台之一,它将理性设计、定向进化与人工智能技术有机结合、交互筛选,是高效、系统、创新型的蛋白质进化平台。
2022年11月30日,美国人工智能实验室OpenAI发布ChatGPT。ChatGPT问世即一举成名,引起全球热议。微软公司表示将把ChatGPT整合到搜索引擎Bing和网络浏览器中,并向ChatGPT的创建者Open AI投资100亿美元;此外ChatGPT成功面试谷歌编程;小说、剧作、漫画ChatGPT也信手拈来。短短两个多月,ChatGPT让人惊叹的表现不胜枚举,人工智能新时代的序幕由此拉开。

 

那么,ChatGPT到底是什么?ChatGPT:Chat Generative Pre-training Transformer,即预训练生成模型,它是能够创建真实对话的深度学习语言模型。它以对话的方式进行交互,能够回答连续性问题、承认错误并进行纠正、质疑不正确的假设,甚至拒绝不适当的请求,是一款具备“学习”、“理解”和“思辨”能力的聊天机器人。
图片
(图片来源:https://learnchatgpt.com)
 
ChatGPT的出现引发的这场AI风暴,令我们不得不感慨人工智能发展之迅速。在生物领域,人工智能近年来也取得了瞩目的成就。前几年AlphaFold2的横空出世,使蛋白质结构预测有了质的飞跃,而今,ProGen的亮相又一次颠覆了蛋白质设计的传统认知。

 

ProGen是由Salesforce Research、Tierra Biosciences 和加州大学的研究团队共同开发的一种新型人工智能系统,能从头开始生成人工酶。研究团队合成了ProGen预测生成的人工酶,并发现其具备天然酶的活性,首次打破了AI预测和实验之间的壁垒,相关论文在《Nature Biotechnology》上发表。

 

ProGen采用了基于标签的深度学习语言模型,用来自超过19000个家族的2.8亿种不同蛋白质的天然氨基酸序列进行训练,这些训练数据包含物种信息、蛋白质家族、催化功能等属性标签,使模型能将蛋白质功能和序列信息进行映射,从而可生成具备预测功能的蛋白质序列。ProGen使从头设计蛋白质就像遣词造句一样简单,给定功能标签和属性等关键词,即可大批量生成蛋白质序列。
图片
(图片来源:Nature Biotechnology)
 
创始人Ali Madani和其他研究人员通过ProGen生成人工溶菌酶,与天然溶菌酶的蛋白质序列一致性仅为31.4%,但实验结果令人惊讶,该人工溶菌酶与天然溶菌酶具有相似的催化效果。由ProGen生成的人工酶的催化效果在其他蛋白质家族,比如在分支酸变位酶和苹果酸脱氢酶中同样得到了验证。
图片
(图片来源:Nature Biotechnology)
 
无论是ChatGPT还是ProGen,其背后的算法均是一种完全基于“自注意力机制”的深度学习模型。深度学习语言模型正在蛋白质设计和改造领域如火如荼地进行,翌圣生物也在AI辅助蛋白质改造领域进行了探索。翌圣ZymeEditorTM平台是翌圣生物酶进化研发中心六大核心技术平台之一,它将理性设计、定向进化与人工智能技术有机结合、交互筛选,是高效、系统、创新型的蛋白质进化平台。
 

 

翌圣ZymeEditorTM平台的理性设计技术具备蛋白质建模、分子对接、分子动力学模拟等技术模块,并结合人工智能深度学习语言模型,对蛋白质进行精准改造,具有准确度高、耗时短、成本低等优势。翌圣ZymeEditorTM平台的超高通量定向进化技术,则可构建优质、超大突变文库,进行自动化、智能化的超高通量筛选,可快速、准确获得具备特定功能的有益突变体。翌圣ZymeEditorTM平台的人工智能技术将理性设计与定向进化湿实验产生的庞大的蛋白质实验数据作为机器学习的数据训练集,更加真实可靠,从而训练出更适合分子酶的语言模型。ZymeEditorTM平台目前已完成130余种高端分子酶的改造和进化,具备扎实的开发高端分子酶的技术基础。
 
图片
图:翌圣ZymeEditorTM平台
 

 

参考文献

 
[1]Madani A, Krause B, Greene ER, Subramanian S, Mohr BP, Holton JM, Olmos JL Jr, Xiong C, Sun ZZ, Socher R, Fraser JS, Naik N. Large language models generate functional protein sequences across diverse families. Nat Biotechnol. 2023 Jan 26. doi: 10.1038/s41587-022-01618-2. Epub ahead of print. PMID: 36702895.
[2]Madani A, McCann B, Naik N, Keskar NS, Anand N, Eguchi RR, Huang PS, Socher R. ProGen: language modeling for protein generation. BioRxiv。2022 Mar 7. doi: https://doi.org/10.1101/2020.03.07.982272.
[3]Jumper J, Evans R, Pritzel A, Green T, Figurnov M, Ronneberger O, Tunyasuvunakool K, Bates R, Žídek A, Potapenko A, Bridgland A, Meyer C, Kohl SAA, Ballard AJ, Cowie A, Romera-Paredes B, Nikolov S, Jain R, Adler J, Back T, Petersen S, Reiman D, Clancy E, Zielinski M, Steinegger M, Pacholska M, Berghammer T, Bodenstein S, Silver D, Vinyals O, Senior AW, Kavukcuoglu K, Kohli P, Hassabis D. Highly accurate protein structure prediction with AlphaFold. Nature. 2021 Aug;596(7873):583-589. doi: 10.1038/s41586-021-03819-2. Epub 2021 Jul 15. PMID: 34265844; PMCID: PMC8371605.
[4]ChatGPT: Optimizing Language Models for Dialogue: https://openai.com/blog/chatgpt/
[5]Radford A, Narasimhan K,Salimans T, Sutskever I.Improving Language Understanding by Generative Pre-Training.
[6]Tools such as ChatGPT threaten transparent science; here are our ground rules for their use. Nature. 2023 Jan;613(7945):612. doi: 10.1038/d41586-023-00191-1. PMID: 36694020.
[7]Riesselman AJ, Ingraham JB, Marks DS. Deep generative models of genetic variation capture the effects of mutations. Nat Methods. 2018 Oct;15(10):816-822. doi: 10.1038/s41592-018-0138-4. Epub 2018 Sep 24. PMID: 30250057; PMCID: PMC6693876.
[8]University of California - San Francisco. "AI technology generates original proteins from scratch: Natural language model jumpstarts protein design with creation of active enzymes." ScienceDaily. ScienceDaily, 26 January 2023..
[9]Stokel-Walker C. AI bot ChatGPT writes smart essays - should professors worry? Nature. 2022 Dec 9. doi: 10.1038/d41586-022-04397-7. Epub ahead of print. PMID: 36494443.

参与评论

全部评论(0条)

相关产品推荐(★较多用户关注☆)
你可能还想看
  • 资讯
  • 技术
  • 百科
  • 应用
  • 植物培养箱的设计
    植物培养箱是一套模拟了适应植物生长的光照和其他气候条件的装置,一般都有监测其光照等环境变量的功能,一旦发现其内部环境达不到植物正常生长的需求,就会自动进行调节。
    2025-10-182804阅读
  • 探索金相图像分析仪规范的新时代
    金相图像分析仪是一套用于铸铁铸钢等材料金相分析的专业仪器。
    2025-10-20108阅读 金相图像分析仪
  • 碰撞试验台的设计方法
    本文将详细探讨碰撞试验台的设计方法,包括其关键设计原则、技术要求及创新应用,旨在为工程师和研究人员提供系统的指导,帮助其开发出高效、安全、精确的碰撞试验设备。
    2025-10-16138阅读 碰撞试验台
  • 固体激光器的特点|设计
    固体激光器是以掺杂的玻璃、晶体或透明陶瓷等固体材料为工作物质的激光器。固体激光器由于功率能量较大而机械工作简单等特点,现在在各行各业都有很好的应用,并且朝着更加发展的方向迈进。
    2025-10-194215阅读
  • 蛋白质纯化系统的操作
    蛋白质纯化系统的操作不仅依赖于的技术,还涉及多个步骤和方法的合理组合。本文将围绕蛋白质纯化系统的操作流程展开,介绍常见的纯化方法以及实际操作中的注意事项,以帮助科研人员和工程师掌握这一技术。
    2025-10-21156阅读 蛋白质纯化系统
  • 查看更多
版权与免责声明

①本文由仪器网入驻的作者或注册的会员撰写并发布,观点仅代表作者本人,不代表仪器网立场。若内容侵犯到您的合法权益,请及时告诉,我们立即通知作者,并马上删除。

②凡本网注明"来源:仪器网"的所有作品,版权均属于仪器网,转载时须经本网同意,并请注明仪器网(www.yiqi.com)。

③本网转载并注明来源的作品,目的在于传递更多信息,并不代表本网赞同其观点或证实其内容的真实性,不承担此类作品侵权行为的直接责任及连带责任。其他媒体、网站或个人从本网转载时,必须保留本网注明的作品来源,并自负版权等法律责任。

④若本站内容侵犯到您的合法权益,请及时告诉,我们马上修改或删除。邮箱:hezou_yiqi

关于作者

翌圣生物科技(上海)股份有限公司

翌圣生物科技(上海)股份有限公司是一家聚焦生命科学产业链上游核心原料,从事分子、蛋白和细胞三大品类生物试剂的研发、生产与销售的高新技术企业。核心产品覆盖qPCR系列、NGS系列、逆转录系列、核酸提取与纯化系列、PCR系列、分子克隆系列、体外转录系列、抗体、蛋白纯化系列、蛋白分析系列、重组蛋白、细胞分析系列、细胞培养系列、细胞转染系列、报告基因检测系列等多个品类,广泛应用于生命科学研究、诊断检测和生物医药等领域。

更多>>ta的最新资讯
实验室必备!翌圣生物《工具酶产品册》电子版免费领!告别选酶 “玄学”!
翌圣春节福利 | 满 2026,年货 “一桶金” 直接抱走!
美国 PAG 33 展会回顾|翌圣 NGS 前沿方案首展落幕,AI 生物信息学持续升温!
关注 私信
近期话题
相关产品

在线留言

上传文档或图片,大小不超过10M
换一张?
取消