仪器网(yiqi.com)欢迎您!

| 注册2 登录
网站首页-资讯-专题- 微头条-话题-产品- 品牌库-搜索-供应商- 展会-招标-采购- 社区-知识-技术-资料库-方案-产品库- 视频

技术中心

当前位置:仪器网>技术中心> 科技文献> 正文

国际期刊 | 新型三模态蛋白质语言模型ProTrek,用自然语言解码蛋白宇宙

来源:翌圣生物科技(上海)股份有限公司 更新时间:2025-10-16 17:30:21 阅读量:122
导读:国际期刊 | 新型三模态蛋白质语言模型ProTrek,用自然语言解码蛋白宇宙

在生命科学的核心地带,始终横亘着一道“模态鸿沟”:我们既有海量的蛋白质序列(如来自测序数据),也有日益增多的三维结构(如来自AlphaFold2和冷冻电镜),还有描述其功能的自然语言文本(如来自UniProt数据库)。然而,传统的工具如BLAST、Foldseck等,如同只精通一种语言的专家,只能在序列或结构等单一模态内进行比对,无法发现序列、结构与功能之间的跨模态联系。


如何打破模态壁垒,构建一个能统一理解蛋白质序列、结构与功能的AI模型,成为了领域内的圣杯之一。





2025年10月2日,西湖大学原发杰、常兴教授团队联合香港科技大学(广州)卢泓远教授团队在Nature BiotechnologyIF=41.7)上发表了文章A tri-modal protein language model enables advanced protein searches,推出了三模态蛋白质语言模型Pro Trek。该模型首次将蛋白质的三种核心信息——氨基酸序列(一维)、三维结构(空间)和自然语言功能描述(语义)——融合于一个统一的语言模型中。



研究亮点

01

通过对比学习,将蛋白质的序列、结构和功能(文本)描述,映射到同一个统一的语义空间中


不同编码器分工合作(上图a),通过三模态对比学习,统一序列、结构和功能的语义空间。

  • 序列编码器:采用在进化尺度上预训练好的ESM-2模型,精准捕捉氨基酸序列中蕴含的进化与结构信息。

  • 结构编码器:创新性地使用Foldseck将三维结构转化为离散的“3Di序列”,再用BERT风格的模型进行编码,巧妙避免了直接处理3D坐标导致的数据泄露问题。

  • 功能编码器:采用在生物医学文献上预训练的PubMedBERT,专门用于理解蛋白质功能的自然语言描述。


02

实现真正的“功能导向”搜索,突破同源进化局限

传统工具基于序列或结构相似性,本质是寻找“同源蛋白”。而Pro Trek基于语义理解,能够发现趋同进化的蛋白——即那些序列和结构迥异,却执行相似功能的蛋白。



以“锌离子结合”为查询时,Foldseck(基于结构)仅找到18个真实相关蛋白,而Pro Trek找到了198个。上图右侧的TM-score矩阵图清晰地显示,这些被Pro Trek找出的蛋白,结构多样性极高(TM-score很低),但它们都共享“锌离子结合”这一功能。


03

从“挖掘”到“设计”,闭环验证模型价值

这项研究没有停留在计算层面,而是通过湿实验完整验证了Pro Trek的实用价值。研究团队利用 ProTrek 从一个包含 2 亿蛋白质的数据库中,通过“序列-序列”和“文本-序列”两种模式并行搜索,寻找与人类尿嘧啶 DNA 糖基化酶(UDG)功能相似但可能效率更高的新蛋白。



对搜索到的Top候选蛋白进行工程化改造(模仿UDG的Y147A突变),并构建成新型碱基编辑器。实验证明,其中排名第一的蛋白变体 (V1) 在多个基因组位点展示了高于现有编辑器(如TSBES EK, gTBE)的胸腺嘧啶编辑效率,且脱靶率更低。


04

极致的效率与用户友好性

开箱即用的网页服务器ProTrek (http://www.search-protrek.com)已收录超过 50 亿蛋白质数据信息,处理速度比传统工具(Foldseck和MMseqs2)快 100 倍以上,可在数秒内完成海量数据库的检索。



翌圣助力产品

在该研究中,研究人员选择了翌圣Canace系列高保真PCRHieff Trans系列细胞转染试剂用于验证分析。



目前翌圣高保真PCR、细胞转染系列的产品已经荣登Nature、 Cell等多个顶级期刊,获得科研大牛们认可!以下仅展示部分助力发表的高分文章:


<上下滑动查看更多>

[1]Jiang Y, Dai A, Huang Y, et al. Ligand-induced ubiquitination unleashes LAG3 immune checkpoint function by hindering membrane sequestration of signaling motifs. Cell. 2025;188(9):2354-2371.e18. doi:10.1016/j.cell.2025.02.014.

[2]Wang WW, Ji SY, Zhang W, et al. Structure-based design of non-hypertrophic apelin receptor modulator. Cell. 2024;187(6):1460-1475.e20. doi:10.1016/j.cell.2024.02.004

[3]Xie F, Zhou X, Ran Y, et al. Targeting FOXM1 condensates reduces breast tumour growth and metastasis. Nature. 2025;638(8052):1112-1121. doi:10.1038/s41586-024-08421-w

[4]Yang X, Wang J, Qi X, et al. HLF and PPARα axis regulates metabolic-associated fatty liver disease through extracellular vesicles derived from the intestinal microbiota. Imeta. 2025;4(2):e70022. Published 2025 Apr 7. doi:10.1002/imt2.70022

[5] Jiang L, Xie X, Su N, et al. Large Stokes shift fluorescent RNAs for dual-emission fluorescence and bioluminescence imaging in live cells. Nat Methods. 2023;20(10):1563-1572. doi:10.1038/s41592-023-01997-7. 

[6] Xia L, Zhang Y, Zhou Q. Structural basis for the recognition of HCoV-HKU1 by human TMPRSS2. Cell Res. 2024;34(7):526-529. doi:10.1038/s41422-024-00958-9 

[7] Liang X, Gong M, Wang Z, et al. LncRNA TubAR complexes with TUBB4A and TUBA1A to promote microtubule assembly and maintain myelination. Cell Discov. 2024;10(1):54. Published 2024 May 21. doi:10.1038/s41421-024-00667-y

[8]Chai Q, Yu S, Zhong Y, et al. A bacterial phospholipid phosphatase inhibits host pyroptosis by hijacking ubiquitin. Science. 2022;378(6616):eabq0132. doi:10.1126/science.abq0132

[9]Liu R, Yang J, Yao J, et al. Optogenetic control of RNA function and metabolism using engineered light-switchable RNA-binding proteins. Nat Biotechnol. 2022;40(5):779-786. doi:10.1038/s41587-021-01112-1

[10]Luo J, Yang Q, Zhang X, et al. TFPI is a colonic crypt receptor for TcdB from hypervirulent clade 2 C. difficile. Cell. 2022;185(6):980-994.e15. doi:10.1016/j.cell.2022.02.010

[11]Chen S, Chen G, Xu F, et al. Treatment of allergic eosinophilic asthma through engineered IL-5-anchored chimeric antigen receptor T cells. Cell Discov. 2022;8(1):80. Published 2022 Aug 16. doi:10.1038/s41421-022-00433-y


特别推荐


长片段高保真PCR试剂-10166ES


  • 长片段扩增:最长可扩增40kb片段。

  • 快速延伸:5-10秒/kb延伸速度,省时高效。

  • 保真性好:83×Taq。

  • 适用性广:覆盖20-80%GC的片段,耐受好。

  • 灵敏度高:可检测低至1 pg的λDNA,100pg的基因组DNA。

  • 稳定可靠:可反复冻融30次。



新型高效转染试剂-40801ES


  • 转染效率更高:可在原代细胞及293T、HeLa、MCF7、HepG2、A549、NIH3T3、RAW267.4、HCT116等细胞系中实现高效转染。

  • 普适性更广:满足DNA、mRNA、siRNA、miRNA、ASO等多种类型核酸转染。

  • 毒性更低:非脂质体、非PEI新型基因递送材料,毒性更低。


图片

图片


翌圣生物


翌圣生物科技(上海)股份有限公司成立于2014年,是一家聚焦生命科学产业链上游核心原料,从事核苷酸、蛋白、细胞和类器官四大品类生物试剂的研发、生产与销售的高新技术企业。公司兼备核心技术自主研发和规模化生产能力,核心产品数量达数千种,覆盖分子克隆、qPCR、NGS、体外转录、抗体、蛋白纯化及分析、细胞培养、转染、报告基因检测和类器官等多种系列,广泛应用于生命科学研究、诊断检测和生物医药等领域。

参与评论

全部评论(0条)

相关产品推荐(★较多用户关注☆)
你可能还想看
  • 技术
  • 资讯
  • 百科
  • 应用
  • 新型动物用呼吸机原理
    动物在面对呼吸系统疾病或手术过程中的麻醉时,往往需要通过机械通气来维持正常的呼吸功能。本文将介绍新型动物用呼吸机的工作原理、创新技术及其在临床中的实际应用,为兽医工作者和相关行业人员提供参考。
    2025-10-22137阅读 动物呼吸机
  • 三用紫外分析仪保养
    为了保证仪器始终处于佳工作状态,定期的保养与维护是不可忽视的重要环节。本文将深入探讨三用紫外分析仪的保养要点,介绍如何通过科学的保养方法提高仪器的度、稳定性,并延长其使用寿命。了解这些保养技巧,不仅能提升实验室工作效率,还能避免因设备故障造成的昂贵维修费用。
    2025-10-0164阅读 紫外分析仪
  • 三用紫外分析仪维护
    其多功能的设计不仅提升了检测效率,也为各行业提供了更准确、可靠的分析手段。任何高精度仪器若缺乏科学的维护,都会影响其性能与使用寿命。本文将详细介绍三用紫外分析仪的维护要点,帮助使用者延长设备的使用寿命,确保检测结果的准确性,从而充分发挥其技术优势。
    2025-10-1349阅读 紫外分析仪
  • 三用紫外分析仪检测标准
    特别是“三用紫外分析仪”作为多功能检测设备,其检测标准直接影响检测结果的准确性与可靠性。本文将深入探讨三用紫外分析仪的检测标准,包括设备性能要求、操作流程、校准规范以及数据记录,以帮助相关行业确保检测过程符合规范,提升产品品质和科研水平。
    2025-10-1854阅读 紫外分析仪
  • 三用紫外分析仪安装
    本文将详细介绍如何正确安装三用紫外分析仪,确保设备在使用过程中的性和稳定性。正确的安装步骤不仅能延长仪器的使用寿命,还能提高实验结果的可靠性。本文章通过具体的安装步骤,帮助用户轻松掌握如何高效设置设备,为后续的分析工作奠定坚实的基础。
    2025-10-2044阅读 紫外分析仪
  • 查看更多
版权与免责声明

①本文由仪器网入驻的作者或注册的会员撰写并发布,观点仅代表作者本人,不代表仪器网立场。若内容侵犯到您的合法权益,请及时告诉,我们立即通知作者,并马上删除。

②凡本网注明"来源:仪器网"的所有作品,版权均属于仪器网,转载时须经本网同意,并请注明仪器网(www.yiqi.com)。

③本网转载并注明来源的作品,目的在于传递更多信息,并不代表本网赞同其观点或证实其内容的真实性,不承担此类作品侵权行为的直接责任及连带责任。其他媒体、网站或个人从本网转载时,必须保留本网注明的作品来源,并自负版权等法律责任。

④若本站内容侵犯到您的合法权益,请及时告诉,我们马上修改或删除。邮箱:hezou_yiqi

关于作者

翌圣生物科技(上海)股份有限公司是一家聚焦生命科学产业链上游核心原料,从事分子、蛋白和细胞三大品类生物试剂的研发、生产与销售的高新技术企业。核心产品覆盖qPCR系列、NGS系列、逆转录系列、核酸提取与纯化系列、PCR系列、分子克隆系列、体外转录系列、抗体、蛋白纯化系列、蛋白分析系列、重组蛋白、细胞分析系列、细胞培养系列、细胞转染系列、报告基因检测系列等多个品类,广泛应用于生命科学研究、诊断检测和生物医药等领域。

更多>>ta的最新文章
干货 | 你的内参基因是Ta嘛?
翌圣LipoBooster 3000转染试剂,经百家实验室验证的高效转染解决方案!
血液肿瘤 NGS 检测全攻略!从应用到原料解决方案一文读懂!
关注 私信
热点文章
突破“递送瓶颈”:创新仿生“智能导弹”重塑癌症mRNA免疫治疗
基尔中国 振动温度传感器是什么?
RMR 综述荐读|西北工业大学王海鹏教授团队视角:去除对流之后,金属如何凝固?空间站 Fe–Si 合金实验的启示
用户心选 | 均匀性拉满,细胞活率超95%?看实测报告揭秘振荡培养箱“稳定密码”
基尔中国 如何怎么检测pH电极的好坏程度
北京师范大学方齐乐团队 Sep. Purif. Technol.:QCM-D 原位揭示碳酸根“助攻”机制,LaOCO实现喀斯特高碳酸盐水体高效除磷
RMR 综述荐读|高强材料如何兼顾安全性?西北有色金属研究院赵永庆教授团队综述航空航天损伤容限与增材制造研究进展
优秀论文|偶氮二异丁腈(AIBN)爆炸链式反应的靶向抑制:气相产物表征与热分解动力学
古河QSFP形态 ELS设计: 带尾纤QSFP形态如何落地
前沿速递 | 近红外纳米探针合成技术再获突破!
近期话题
相关产品

在线留言

上传文档或图片,大小不超过10M
换一张?
取消