在陆地上,鱼类依然摆动着鳍,但在水中,它们的表现却截然不同。这一比喻源自著名计算机科学家艾伦·凯(Alan Kay),用以强调背景在阐释所研究问题时的重要性。
在人工智能(AI)领域,名为PINNACLE的工具体现了凯的见解,尤其是在理解蛋白质在适宜环境下的行为时,这些蛋白质所处的组织和细胞对其行为有着决定性影响。值得一提的是,PINNACLE克服了现有人工智能模型的一些局限性,这些模型通常只分析蛋白质的功能和故障,且是在孤立的条件下进行的,每次只能分析一种细胞或组织类型。
这种新型人工智能模型的开发在《自然方法》杂志上得到了描述,由哈佛医学院的研究团队主导。
“自然界是相互关联的,PINNACLE帮助识别这些联系,使我们能够获得关于蛋白质及更安全、更有效药物的深入理解,”该研究的资深作者、HMS Blavatnik研究所生物医学信息学助理教授Marinka Zitnik表示。“它克服了当前无上下文模型的局限性,并为增强蛋白质相互作用分析提供了未来的方向。”
研究人员指出,这一进展将推动对蛋白质在健康与疾病中作用的理解,并为设计更精确、更具针对性的治疗方法提供新的药物靶点。
全球的科学家均可免费使用PINNACLE。
向前迈出的一大步
揭示蛋白质之间的相互作用及其周围生物环境的影响是一个复杂的任务。目前的分析工具通过提供单个蛋白质的结构特征和形状信息发挥了重要作用。然而,这些工具并未设计用于解决整个蛋白质环境的上下文细微差别。相反,它们生成的蛋白质特征与上下文无关,缺乏细胞类型和组织类型的相关信息。
然而,蛋白质在不同细胞和组织环境中扮演着不同的角色,且同一组织或细胞的健康状态也会影响其功能。单一蛋白质模型无法识别在多种情况下变化的蛋白质功能。
蛋白质行为的关键在于位置
蛋白质由20种不同的氨基酸构成,是细胞和组织的基本组成部分,维持生命所需的多种生物功能不可或缺——从输送氧气到肌肉收缩、促进消化和抵抗感染等。
科学家估计,人体内的蛋白质数量在2万到数十万之间。
蛋白质之间相互作用,同时也与其他分子如DNA和RNA发生交互。
蛋白质之间复杂的相互作用形成了复杂的蛋白质相互作用网络。这些网络存在于细胞内部或细胞之间,与其他蛋白质和蛋白质网络进行多种复杂的交互。
PINNACLE的优势在于其能够识别蛋白质行为因细胞和组织类型而异的能力。同一种蛋白质在健康的肺细胞中可能具有与在健康的肾细胞或患病的结肠细胞中不同的功能。
PINNACLE揭示了不同细胞和组织如何以不同方式影响相同的蛋白质,这是目前模型无法实现的。根据蛋白质网络所在的特定细胞类型,PINNACLE能够识别哪些蛋白质参与某些交互,哪些蛋白质保持沉默。这有助于PINNACLE更好地解码蛋白质的相互作用和行为类型,最终使其能够预测导致疾病的功能失调蛋白质的精准药物靶标。
研究人员指出,PINNACLE并不排斥单一表征模型,而是对其进行了补充,因为它能够分析不同细胞环境下的蛋白质相互作用。
因此,PINNACLE能够帮助研究人员更好地理解和预测蛋白质的功能,并有助于阐明重要的细胞过程和疾病机制。
这种能力可以帮助精确定位“可药物”蛋白质,作为个体药物的靶标,并预测各种药物对不同细胞类型的影响。因此,PINNACLE可能成为科学家和药物开发人员更有效地瞄准潜在目标的宝贵工具。
兹特尼克表示,优化这一药物发现过程是非常必要的,他也是哈佛大学肯普纳自然与人工智能研究所的副教员。
将一种新药推向市场可能需要10到15年的时间,耗资高达10亿美元,而从发现到药物的过程往往充满挑战,最终结果常常不可预测。事实上,近90%的候选药物未能成为最终药物。
PINNACLE的构建与训练
研究人员利用来自综合多器官图谱的人类细胞数据,结合蛋白质相互作用、细胞类型与细胞类型之间的交互以及组织的多个网络,训练PINNACLE生成包含156种细胞类型和62种组织与器官的全景图形蛋白质表示。
迄今为止,PINNACLE已生成近395,000个多维表示,而在当前的单蛋白质模型下,仅有约22,000个可能的表示。其156种细胞类型中的每一种都包含约2500种蛋白质的上下文丰富的相互作用网络。
目前的细胞类型、组织和器官数量并不是该模型的上限。迄今为止评估的细胞类型均来自活体供体,覆盖了人体的大部分细胞类型,但并非全部。此外,许多细胞类型尚未被确定,其他细胞类型则较为稀少或难以探测,例如大脑中的神经元。
为了使PINNACLE的细胞库更加多样化,Zitnik计划利用一个数据平台,其中包括从整个人体取样的数千万个细胞。
作者、资金与信息披露
该论文的其他作者包括Michelle M. Li、Yepeng Huang、Marissa Sumathipala、Man Qing Liang、Alberto Valdeolivas、Ashwin N. Ananthakrishnan、Katherine Liao和Daniel Marbach。Marbach和Valdeolivas受雇于F. Hoffmann-La Roche Ltd.;其他作者声明没有利益冲突。
研究经费由美国国立卫生研究院提供(R01HD108794;R01DK127171,P30 AR072577,T32HG002295),美国国家科学基金会(CAREER 2339524),美国国防部(FA8702-15-D-0001),哈佛大学数据科学计划,亚马逊学院研究,谷歌研究学者计划,阿斯利康研究,罗氏杰出科学家联盟,赛诺菲iDEA-iTECH奖,辉瑞研究,陈扎克伯格计划,HMS约翰和弗吉尼亚Kaneb奖学金奖,帕金森科学联合(ASAP)计划,比斯瓦斯计算生物学计划与米尔肯研究所、哈佛医学院人工智能使用院长创新奖以及哈佛大学肯普纳自然与人工智能研究所合作。
本文来自作者[之萱]投稿,不代表飕飕号立场,如若转载,请注明出处:https://wap.soso818.com/zskp/202508-3838.html
评论列表(4条)
我是飕飕号的签约作者“之萱”!
希望本篇文章《创新AI工具揭示蛋白质在特定环境中的动态表现》能对你有所帮助!
本站[飕飕号]内容主要涵盖:国足,欧洲杯,世界杯,篮球,欧冠,亚冠,英超,足球,综合体育
本文概览: 在陆地上,鱼类依然摆动着鳍,但在水中,它们的表现却截然不同。这一比喻源自著名计算机科学家艾伦·凯(Alan Kay),用以强调背景在阐释所研究问题时的重...