《人工智能加速抗生素发现.docx》由会员分享,可在线阅读,更多相关《人工智能加速抗生素发现.docx(4页珍藏版)》请在第一文库网上搜索。
1、Sitehttps:/bindingmoad.orghttps:/www.bindingdb.org/https:/www.brenda-enzymes.orghttps:/www.ebi.ac.uk/chembl/https:/drugdesigndata.orghttps:/clue.io/repurposinghttp:/moleculenet.aihttps:/www.wwpdb.orghttps:/pubchem.ncbi.nlm.nih.govhttp:/stitch.embl.dehttp:/sideeffects.embl.dehttp:/insilico.charite.de
2、/supertarget/https:/zitniklab.hms.harvard.edu/TDChttps:/www.uniprot.orghttps:/zinc15,docking.orghttp:/bioinformatics.cs.ntou.edu.tw/adam/http:/gec.u-picardie.fr/adaptablehttp:/www.camp.bicnirrh.res.inhttp:/dramp.cpu-bioinfor.orghttps:/dbaasp.orghttp:/140.138.77.240/-dbamphttps:/megares.meglab.orghtt
3、ps:/www.ncbi.nlm.nih.goy/https:/www.patricbrc.orghttps:/tdrtargets.org摘要:抗生素通过针对入侵的生物体将自己置身于宿主-病原体的进化军备竞赛中。然而,随着病原体因自然选择进化出的耐药性,抗生素治疗效果下降。另外,抗生素的研发是一个成本高及周期长的工程,耐药性的出现促使人们对有望加快候选药物发现的计算方法产生了极大的兴趣。本文阐述了人工智能在小分子抗生素和抗菌肽的发现方面取得的进展。除了抗菌活性的基本预测外,还强调抗菌化合物的表征、类药性的预测、抗菌素耐药性和从头分子设计。人工智能加速抗生素发现Ref : Commun. Bi
4、ol. Published: 9 September 2021 IF=6.268链接:https:/doi.org/10.1038/s42003-021-02586-01研究背景细菌耐yao性(AMR)的出现减弱了抗生素的功效,使全球发病率和死亡率水平升高。美国疾病控制和预防中心估计,美国每年有280万感染是由耐药细菌引起的,其中有3.5万人死于这种无法治疗的感染。临床试验中的抗生素也与现有的耐药机制的药物类似,进一步强调了发现全新抗生素的必要性。抗生素的研发是一个成本高及周期长的工程。2014年至2019年期间,只有14种新的抗生素成功研发并通过审批。在一项对超过21000种化合物的近186
5、000项临床试验的调查中,研发的新药能够成功治疗传染病的可能性仅为25.2%。这种失败的风险促使企业以更高的投资回报保证进行研发,为学术界启动抗生素设计和优化的早期阶段开辟了道路。随着人工智能和大数据领域的广泛应用,有可能从根本上改变药物发现中计算模型的准确性和可靠性。可用的开源数据集(表1 X计算机工程的进步以及机器学习算法模型,极大地促进了机器学习在药物发现,特别是抗生素发现中的应用。本文主要介绍了人工智能在小分子抗生素和抗菌肽研发中的应用。表1与抗生素研发相关的数据库DatabaseGeneral drug discovery and biomolecular informaticsBi
6、nding MOAD160BindingDB161BRENDA162ChEMBL163Drug Design Data ResourceDrug Repurposing Hub140DrugBank164MoleculeNet165Protein Data Bank166PubChem167Search Tool for Interacting Chemicals168Side Effect Resource169SuperTarget170Therapeutics Data CommonsTherapeutic Target DB171UniProt172ZINC173Exclusively
7、 infectious diseaseADAM174ADAPTABLE175Collection of Antimicrobial Peptides176Data Repository of Antimicrobial Peptides177DB of Antimicrobial Activity and Structure of Peptides178dbAMP179MEGARes: Antimicrobial DB for High-Throughput Sequencing180National DB of Antibiotic-Resistant OrganismsPathosyste
8、ms Resource Integration Center181Tropical Disease Research Targets182Public databases (DB) of general use in computational drug discovery and biomolecular informatics, as well as those specific to antimicrobial discovery and resistance.2化合物表征为避免浪费大量时间用于合成非活性化合物和进行实验,研究人员通过计算来预测新设计分子的活性,在计算模型中分子的表征也是
9、比较重要的一部分(图1 分子的各种性质和实验可以产生大量的信息。如,为了描述简单的氨基酸残基,在线数据库中已经有400多个不同的测量方法;对于小分子药物,有计算和压缩量子力学推导出的描述符来表示拓扑性质的方法。然而,多次测量中包含的大量数据和冗余信息使得使用所有描述符变得不切实际或适得其反。因此,需要将实验数据组合成简单的描述符,以尽可能少的维度来描述尽可能多的信息。如本文中提到可是使用图卷积网络,利用分子的几何形状和连接性将它们自然地转换成图,使用神经网络从化学结构中学习分子的特征。循环神经网络(RNN )也多用于处理分子的SMILES表示,或结合长短期记忆神经网络(LSTM )从已知药物的
10、SMILES学习分子特征并生成新的化合物,或RNN也可与强化学习结合,根据药物的SMILES生成药物的embedding特征。止矽卜,RNN还用于抗菌肽的表征。图1基于人工智能抗生素的研发方法3抗菌活性预测抗菌活性的预测是机器学习整合到抗生素开发中的核心,经过多年的研究并为此提供了新的解决方案。如,研究人员使用逻辑回归对训练集中的分子片段进行分类,构造了一个基于分子片段的活性“片段库”,可以将这些分子片段拼接起来作为有活性的新抗生素;研究人员利用神经网络来表示化合物,然后评估其抗菌能力,以试图从现有的药物中选出具有抗菌作用的药物;基于支持向量机预测分子的抗菌活性;基于深度神经网络预测多肽对铜绿
11、假单胞菌的活性;基于RNN的回归模型对抗菌肽活性的预测等方法。4性质预测较差的药代动力学特性和毒性是临床试验失败的主要原因,因此迫切需要借助机器学习或深度学习的方法对此进行预测。预测的性质主要包括吸收、分布、代谢、排泄和毒性(ADMETI本文也提到有一系列工作分别利用神经网络、分类树、梯度提升分类器和共识模型预测抗菌肽和类抗菌肽药物的溶血活性。也有一系列研究利用随机森林、深度神经网络和深度泰勒分解用于预测候选药物的细胞毒性。为考虑抗菌肽的溶解性和稳定性。已有相关工作借用神经网络、梯度增强模型、逻辑回归分类器、支持向量福随机森林预测蛋白质溶解度。因为蛋白酶的降解也会影响抗菌肽稳定性的评估,所以可
12、利用支持向量机、卷积神经网络、随机森林分类器和逻辑回归模型来预测水解位点,以有利于先导抗菌肽的挑选和稳定性优化。5耐药性预测与大多数治疗方法不同,抗生素设计的目标是杀死具有耐药性进化能力的细菌。因此,抗生素药物设计需要考虑细菌耐药性进化。虽然当前已有基于机器学习的耐药性预测方法在临床上预测抗生素配方的耐药性,但它也可能在药物开发的实验中有用。基于耐药性基因组学的机器学习方法将越来越多地专门用于药物开发,例如利用机器学习对先导化合物的耐药性实验进行预测。目前基于机器学习的抗药性预测都是基于细菌的基因组特征,而不是药物或分子靶点特征。已有工作基于病原体基因组数据训练了能够预测细菌对抗生素的敏感性和
13、耐药性表型的机器学习模型。也有工作利用SVM预测外排介导的耐药性。虽然黑盒方法可能会限制机器学习在降低耐药风险的效果,但可解释性的模型可以使模型能够在机体和种群规模上找出耐药性的进化原因。将机器学习与基因-蛋白结构图谱,相结合,可研究结核分枝杆菌耐药性进化的驱动因素,其假设赋予细菌耐药性的基因之间的相互作用表现为它们在SVM超平面的权重和符号的相关性。另外,也可基于蛋白质同源性的基因变异定位的可解释耐药性预测。6基于生成模型抗生素的发现生成模型已经被用于化学工程和蛋白质工程,包括无机物的逆向设计和基于图的神经网络模型蛋白质折叠生成。作者着重介绍分子从头设计,其通常使用生成对抗网络(GANs),
14、变分自动编码器(VAEs)相关的架构。已有工作分别利用了结合深度强化学习的生成网络,深度生成对抗自动编码器,可微分强化学习和对抗训练神经网络,结合蒙特卡罗树搜索的深度神经网络,结合随机和目标指引分子设计的自动编码器GAN用于从头药物设计。鉴于对序列数据的适用性,也有工作利用接受SMILES输入的RNN模型进行药物设计。如GAN已被用于生成对大肠杆菌的最低抑制浓度明显低于氨节青霉素的抗菌肽。基于迁移学习的LSTM生成模型表明,在对较小数据集的目标特异性生物活性分子进行微调后,可以成功生成已知的靶向金黄色葡萄球菌的分子。此外,有研究者在一个基于单向LSTM的抗菌肽设计中,观察到82%的生成肽是潜在
15、的抗菌肽,而训练数据的氨基酸分布中只有65%的随机排列被预测为抗菌素。综之,基于机器学习或深度学习的方法均可加速抗生素或抗菌肽的发现。利用人工智能可能从根本上改变药物发现中计算模型的准确性和可靠性,在实验中拥有一个称手的人工智能工具是可以大幅提升实验效率的神器,下面以MaXFlow产品为例向大家介绍人工智能工具。可以使分子模拟分子模拟,是MaXFlow产品很重要的功能。当2021年再去谈及分子模拟,我们更愿意将之形容成一个工具,这实际上是MaXFlow产品设计的一个很重要的目标,就是把一种过去认为是技术的东西变成一种真正的工具,特别是能够满足实验工作人员使用的一种工具。正是因为目标不同,使得MaXFlow中的分子模拟区别于其它的分子模拟软件。人工智能MaXFlow提出人工智能主要针对材料和生物医药这两个领域,这种具有针对性的人工智能跟大家通常所说的购物网站、人脸识别的人工智能是不同的,其更多关注材料和生物医药这两个领域中人工智能的方法以及模型。工作流MaXFlow的设计理念