《子宫内膜癌潜在药物的筛选—基于基因表达谱数据库CMAP和分子对接工具.docx》由会员分享,可在线阅读,更多相关《子宫内膜癌潜在药物的筛选—基于基因表达谱数据库CMAP和分子对接工具.docx(22页珍藏版)》请在第一文库网上搜索。
1、子宫内膜癌潜在药物的筛选一基于基因表达谱数据库(CMAP)和分子对接工具邹雪婷1郭祎男*1西北妇女儿童医院陕西,西安摘要目的:通过分子对接技术初步探索小分子化合物与子宫内膜癌相关蛋白的结合模式与相互作用,为小分子化合物在子宫内膜癌治疗研究和临床应用提供理论基础。方法:采用TCGA和GTEx技术筛选子宫内膜癌的差异表达基因(DEGs)o通过GO和KEGG通路富集分析,构建蛋白-蛋白相互作用(PP1)网络和药物基因网络,预测相关靶点和通路,阐明子宫内膜癌的潜在分子机制。将差异基因与CMAP数据库中药物的基因组表达谱进行比较,筛选出具有特异性的小分子化合物。结果:筛选出112个UCEC的相关基因,其
2、中48个基因上调,64个基因下调。GO和KEGG分析表明,这些基因主要集中在血管平滑肌收缩、紧密连接、细胞粘附分子等通路。通过与CMAP数据库的差异表达基因的比较,得出25种化合物可能与UCEC的治疗有关。分子对接结果表明,19个化合物与DEGS对接结果的准确率较高,对接得分大于5.52。结论:本研究通过CMAP数据库预测子宫内膜癌相关小分子药物,利用分子对接技术和生物信息学初步探索橙皮素和木犀草素治疗子宫内膜癌的可能性,为后续的体外和体内实验提供了新的方向。关键词:子宫内膜癌;CMAP;分子对接;通路;富集分析Screeningofpotentia1agentsforendometria1c
3、arcinomabasedonconnectivitymappingandmo1ecu1ardockingXuetingZou1Yi-nanGuo*1NorthwestWomen,sandChi1dren,sHospita1,ShaanxiXi,AnAbstract:Objective:Mo1ecu1ardockingtechno1ogywasusedtopre1iminari1yexp1orethebindingmodeandinteractionbetweensma11mo1ecu1ecompoundsandendometria1cancer-re1atedproteins.Inorder
4、toprovidetheoretica1basisforthetreatmentandc1inica1app1icationofsma11mo1ecu1ecompoundsinendometria1cancer.Methods:First1y,TCGAandGTExwereusedtoscreenthedifferentia11yexpressedgenes(DEGs)ofendometria1cancer.Subsequent1y,GeneOnto1ogy(GO)annotationsandre1evantsigna1pathwayenrichmentana1yseswereconducte
5、d,andprotein-proteininteractions(PPI)networkanddruggenenetworkwereconstructedtopredictre1evanttargetsorpathwaysandi11uminatethepotentia1mo1ecu1armechanismofendometria1cancer.Afterwards,thedifferentia1geneswerecomparedwiththegenomicexpressionprofi1esofdrugsintheconnectiveMapdatabase(CMap)toscreenouts
6、ma11mo1ecu1arcompoundsthatactonendometria1cancer.Fina11y,Mo1ecu1ardockingwasusedtoinvestigatethebindingpatternsandinteractionsu1terior1ybetweenthesepotentia1drugsanddifferentia1proteinsinendometria1cancer.Resu1ts:Atota1of112UCEC-re1atedgeneswereidentified.Thereinto48geneswereup-regu1atedand64geneswe
7、redown-regu1ated.GOandKEGGana1ysisrepresentedthatthesegenesweremain1yconcentratedinvascu1arsmoothmusc1econtraction,tightjunctions,ce11adhesionmo1ecu1esandotherpathways.Bycomparingthedifferentia11yexpressedgeneswiththeCMapdatabase,itwasconc1udedthat25compoundsmaybere1atedtothetreatmentofendometria1ca
8、ncer.Theresu1tsofmo1ecu1ardockingshowedthattheaccuracyofthedockingresu1tsbetween19compoundsandtheDEGswashigher,withthedockingscoregreaterthan5.52.Conc1usion:Inthisstudy,wepredictedsma11-mo1ecu1edrugsre1atedtoendometria1cancerthroughtheCMAPdatabase,andpre1iminari1yexp1oredthepossibi1ityofhesperidinan
9、dIuteo1ininthetreatmentofendometria1cancerbyusingmo1ecu1ardockingtechno1ogyandbioinformatics,whichprovidedanewdirectionforsubsequentin-vitroandin-vivoexperiments.Keywords:Uterinecorpusendometria1carcinoma;ConnectivityMap;Mo1ecu1ardocking;pathway;enrichmentana1ysis子宫内膜癌(UterineCorpusEndometria1Carcin
10、oma,UCEC)是女性生殖系统最常见的恶性肿瘤之一,约占女性生殖道恶性肿瘤的20%30%1o多年来,随着人类寿命的延长和社会生活因素的变化,UCEC发病率呈上升趋势,年龄呈年轻化趋势2。目前,手术治疗仍是UCEC的首选治疗方法,对于无法接受手术治疗的晚期肿瘤患者,可采用放疗、化疗或激素治疗3。本研究将UCEC的差异基因(DEGS)与CMAP数据库中已知的基因集进行比较,通过统计计算发现疾病与小分子药物之间的关系4。随后,通过分子对接研究小分子化合物与子宫内膜癌相关蛋白的结合模式及相互作用。同时,结合多种生物信息学方法,结合相关文献检索,对小分子药物的靶点及可能的抗癌机制进行初步预测。1材料与
11、方法1.1 UCEC相关基因的收集下载GTEx和TCGA数据库中正常子宫内膜与子宫内膜癌数据集,使用per1脚本合并为同一矩阵,去除批次效应后使用R语言Iimma包进行差异分析。本研究将过滤条件设为1og2(fo1dchange)5,P-va1ue调整为P0.05,采用1og2算法计算。1.2 DEGs基因功能富集分析为了从系统的角度研究子宫内膜癌的分子机制,寻找潜在药物的靶点,采用WebGeSta1t()在线分析工具,对DEGS的Gc)功能富集进行注释,并分析所涉及的KEGG和Panther路径5。疾病本体论(De)分析使用R语言“DO”包。将DEGS输入STR1NG数据库(),构建蛋白-蛋
12、白相互作用网络。至少5个具有连接节点的基因被认为是Hub基6。利用Cytoscape软件(333版本)对PPI网络进行可视化。1.3 利用CMAP数据库筛选小分子药物CMAP是目前最具影响力的活性化合物或药物相关基因表达谱数据库。利用CMAP数据库对DEGs进行分析,可得到与UCEC相关的药物。计算了富集相关系数,其范围为-1-1。得分为阳性的药物表现为小分子化合物或药物与特定的生物过程或状态具有相似或同向关系。所研究的药物具有与小分子化合物或药物相似的作用机制。而得分为负值的药物则表明其作用机制相反,其绝对值和相关性越大7o为了获得与UCEC相关的药物,将上述差异基因输入CMAP,比较表达谱
13、,筛选和分析得分接近-1的潜在药物。然后将候选药物输入STrreH数据库,构建药物相互作用网络,进一步探讨药物在子宫内膜癌治疗中的关系。1.4 验证UCEC相关蛋白和基因的表达人类蛋白质图谱O提供了2.4万个人类蛋白质的组织和细胞分布信息。采用免疫组化方法检测各蛋白在组织中的分布和表达情况,利用免疫组化染色方法表达结果,并由专业人员进行阅读和标记,确保染色结果具有充分代表性网。同时该网站提供TCGA和GTEx数据库中mRNA水平的可视化结果,并结合数据库进一步验证相关蛋白和基因在子宫内膜癌组织和非癌组织中的表达。1.5 分子对接精度的准确性通过系统对接在线工具,我们可以了解子宫内膜癌相关药物与
14、蛋白质之间的相互作用9。我们将Hub蛋白的PDBID和小分子化合物的结构上传到系统对接网站,得到相应的对接评分,评分范围一般为O-IOo10O如果HUb蛋白的PDB结构没有天然配体,则不作进一步分析。2结果2.1 从TCGA和GTEx中收集到112个UCEC相关基因通过上述方法从TCGA和GTEx数据库中共获得2个高表达基因,其中上调基因41个,下调基因43个(图1)。2.2 112个DEGs基因的功能富集和通路分析通过富集分析发现,这些基因基本参与了肌肉收缩、组织发育、上皮细胞分化、上皮细胞发育、细胞外基质形成、侧膜、细胞骨架、顶端连接复合体等细胞组成、分子功能和生物学过程。具有分布分子活性
15、、转录激活因子和通道调控过程(图2)。止匕外,这些基因在血管平滑肌收缩、紧密连接、细胞粘附分子、钙信号通路以及KEGG通路中的局灶粘附通路中显著富集。通过Do分析提供具有疾病相关注释信息的基因,结果显示泌尿系统肿瘤、肾癌和卵巢癌与UCEC的相关性最大(图3)o我们发现C1DN4,PRSS8,C1DN7,EPCAM,CDH1,KRT7,C1DN3,SPP1,DCN,WT1,CNN1,CDC20,TAG1N,UBE2C,SORBS1,TOP2A,MYH11,MY1K,ACTA2,1MOD1,ACTG2,DES和RERG至少有5个连接节点通过PPI网络与其他蛋白质构成链接,这意味着他们彼此之间都有着
16、密切的联系(图4)o2.3 基于CMAP数据库获得25种候选药物我们将112个差异表达基因上传到CMAP中,比较表达谱的相似性,最终确定连接性评分-09共获得25个可能与子宫内膜癌治疗相关的小分子化合物图5,包括橙皮背、木质素、格列美胭、芬苯达哇、磷酸腺昔、西罗莫司等。为了分析药物与蛋白质的相互作用,我们利用ST1CH数据库构建药物-蛋白质相互作用网络,获得候选药物的靶蛋白,并与HUb蛋白进行交叉。结果显示CDH1与木犀草素直接相关,与其他药物间接相关(图6)。2.4 人类蛋白图谱数据库验证通过挖掘人类蛋白图谱数据库,比较Hub蛋白在子宫内膜癌和非癌组织中的表达,发现大多数蛋白的表达结果存在显著差异,其中CDH1作为肿瘤抑制基因,在正常组织中高表达,但弱阳性,甚至在子宫内膜癌中未检测到,它表明CDH1蛋白水平下调(图7)。另一方面,通过TCGA和GTEx数据库,CDH