《子宫内膜癌潜在药物的筛选—基于基因表达谱数据库CMAP和分子对接工具.docx》由会员分享,可在线阅读,更多相关《子宫内膜癌潜在药物的筛选—基于基因表达谱数据库CMAP和分子对接工具.docx(22页珍藏版)》请在第一文库网上搜索。
1、子宫内膜癌潜在药物的筛选一基于基因表达谱数据库(CMAP) 和分子对接工具邹雪婷1郭祎男*1西北妇女儿童医院陕西,西安摘要目的:通过分子对接技术初步探索小分子化合物与子宫内膜癌相关蛋 白的结合模式与相互作用,为小分子化合物在子宫内膜癌治疗研究和 临床应用提供理论基础。方法:采用TCGA和GTEx技术筛选子宫内膜癌的差异表达基因 (DEGs)o通过GO和KEGG通路富集分析,构建蛋白-蛋白相互作用 (PPl)网络和药物基因网络,预测相关靶点和通路,阐明子宫内膜癌的 潜在分子机制。将差异基因与CMAP数据库中药物的基因组表达谱 进行比较,筛选出具有特异性的小分子化合物。结果:筛选出112个UCEC
2、的相关基因,其中48个基因上调,64个 基因下调。GO和KEGG分析表明,这些基因主要集中在血管平滑肌 收缩、紧密连接、细胞粘附分子等通路。通过与CMAP数据库的差 异表达基因的比较,得出25种化合物可能与UCEC的治疗有关。分 子对接结果表明,19个化合物与DEGS对接结果的准确率较高,对 接得分大于5.52。结论:本研究通过CMAP数据库预测子宫内膜癌相关小分子药物,利 用分子对接技术和生物信息学初步探索橙皮素和木犀草素治疗子宫 内膜癌的可能性,为后续的体外和体内实验提供了新的方向。关键词:子宫内膜癌;CMAP;分子对接;通路;富集分析Screening of potential agen
3、ts for endometrial carcinoma based on connectivity mapping and molecular dockingXueting Zou1 Yi-nan Guo*1Northwest Women,s and Children ,s Hospital ,Shaanxi Xi,AnAbstract:Objective: Molecular docking technology was used to preliminarily explore the binding mode and interaction between small molecule
4、 compounds and endometrial cancer-related proteins. In order to provide theoretical basis for the treatment and clinical application of small molecule compounds in endometrial cancer.Methods: Firstly, TCGA and GTEx were used to screen the differentially expressed genes (DEGs) of endometrial cancer.
5、Subsequently, Gene Ontology (GO) annotations and relevant signal pathway enrichment analyses were conducted, and protein-protein interactions (PPI) network and drug gene network were constructed to predict relevant targets or pathways and illuminate the potential molecular mechanism of endometrial c
6、ancer. Afterwards, the differential genes were compared with the genomic expression profiles of drugs in the connective Map database (CMap) to screen out small molecular compounds that act on endometrial cancer. Finally, Molecular docking was used to investigate the binding patterns and interactions
7、 ulteriorly between these potential drugs and differential proteins in endometrial cancer.Results: A total of 112 UCEC-related genes were identified. Thereinto 48 genes were up-regulated and 64 genes were down-regulated. GO and KEGG analysis represented that these genes were mainly concentrated in v
8、ascular smooth muscle contraction, tight junctions, cell adhesion molecules and other pathways. By comparing the differentially expressed genes with the CMap database, it was concluded that 25 compounds may be related to the treatment of endometrial cancer. The results of molecular docking showed th
9、at the accuracy of the docking results between 19 compounds and the DEGs was higher, with the docking score greater than 5.52.Conclusion: In this study, we predicted small-molecule drugs related to endometrial cancer through the CMAP database, and preliminarily explored the possibility of hesperidin
10、 and Iuteolin in the treatment of endometrial cancer by using molecular docking technology and bioinformatics, which provided a new direction for subsequent in-vitro and in-vivo experiments.Keywords: Uterine corpus endometrial carcinoma; Connectivity Map; Molecular docking; pathway; enrichment analy
11、sis子宫内膜癌(Uterine Corpus Endometrial Carcinoma, UCEC )是 女性生殖系统最常见的恶性肿瘤之一,约占女性生殖道恶性肿瘤的 20% 30%lo多年来,随着人类寿命的延长和社会生活因素的变化,UCEC发病率呈上升趋势,年龄呈年轻化趋势2。目前,手术治疗仍 是UCEC的首选治疗方法,对于无法接受手术治疗的晚期肿瘤患者, 可采用放疗、化疗或激素治疗3。本研究将UCEC的差异基因(DEGS) 与CMAP数据库中已知的基因集进行比较,通过统计计算发现疾病 与小分子药物之间的关系4。随后,通过分子对接研究小分子化合 物与子宫内膜癌相关蛋白的结合模式及相互作用。
12、同时,结合多种生 物信息学方法,结合相关文献检索,对小分子药物的靶点及可能的抗 癌机制进行初步预测。1材料与方法1.1 UCEC相关基因的收集下载GTEx和TCGA数据库中正常子宫内膜与子宫内膜癌数据集, 使用perl脚本合并为同一矩阵,去除批次效应后使用R语言Iimma 包进行差异分析。本研究将过滤条件设为log2(foldchange) 5,P -value 调整为P 0.05,采用log2算法计算。1.2 DEGs基因功能富集分析为了从系统的角度研究子宫内膜癌的分子机制,寻找潜在药物的 靶点,采用WebGeStalt ()在线分析工具,对DEGS的Gc)功能富集进 行注释,并分析所涉及的
13、KEGG和Panther路径5。疾病本体论(De) 分析使用R语言“DO”包。将DEGS输入STRlNG数据库(),构建蛋 白-蛋白相互作用网络。至少5个具有连接节点的基因被认为是Hub 基6。利用Cytoscape软件(333版本)对PPI网络进行可视化。1.3 利用CMAP数据库筛选小分子药物CMAP是目前最具影响力的活性化合物或药物相关基因表达谱数 据库。利用CMAP数据库对DEGs进行分析,可得到与UCEC相关 的药物。计算了富集相关系数,其范围为-1-1。得分为阳性的药物 表现为小分子化合物或药物与特定的生物过程或状态具有相似或同 向关系。所研究的药物具有与小分子化合物或药物相似的作
14、用机制。 而得分为负值的药物则表明其作用机制相反,其绝对值和相关性越大 7o为了获得与UCEC相关的药物,将上述差异基因输入CMAP, 比较表达谱,筛选和分析得分接近-1的潜在药物。然后将候选药物输 入STrreH数据库,构建药物相互作用网络,进一步探讨药物在子宫 内膜癌治疗中的关系。1.4 验证UCEC相关蛋白和基因的表达人类蛋白质图谱O提供了 2.4万个人类蛋白质的组织和细胞分 布信息。采用免疫组化方法检测各蛋白在组织中的分布和表达情况, 利用免疫组化染色方法表达结果,并由专业人员进行阅读和标记,确 保染色结果具有充分代表性网。同时该网站提供TCGA和GTEx数 据库中mRNA水平的可视化
15、结果,并结合数据库进一步验证相关蛋 白和基因在子宫内膜癌组织和非癌组织中的表达。1.5 分子对接精度的准确性通过系统对接在线工具,我们可以了解子宫内膜癌相关药物与蛋 白质之间的相互作用9。我们将Hub蛋白的PDB ID和小分子化合物 的结构上传到系统对接网站,得到相应的对接评分,评分范围一般为O-IOo 10O如果HUb蛋白的PDB结构没有天然配体,则不作进一 步分析。2结果2.1 从TCGA和GTEx中收集到112个UCEC相关基因通过上述方法从TCGA和GTEx数据库中共获得2个高表达基 因,其中上调基因41个,下调基因43个(图1)。2.2 112个DEGs基因的功能富集和通路分析通过富
16、集分析发现,这些基因基本参与了肌肉收缩、组织发育、 上皮细胞分化、上皮细胞发育、细胞外基质形成、侧膜、细胞骨架、 顶端连接复合体等细胞组成、分子功能和生物学过程。具有分布分子 活性、转录激活因子和通道调控过程(图2)。止匕外,这些基因在血管平滑肌收缩、紧密连接、细胞粘附分子、 钙信号通路以及KEGG通路中的局灶粘附通路中显著富集。通过Do 分析提供具有疾病相关注释信息的基因,结果显示泌尿系统肿瘤、肾 癌和卵巢癌与UCEC的相关性最大(图3)o我们发现 CLDN4, PRSS8, CLDN7, EPCAM, CDHl, KRT7, CLDN3, SPPl, DCN, WTl, CNNl, CDC20, TAGLN, UBE2C, SORBSl, TOP2A, MYHll, MYLK, ACTA2, LMODl, ACTG2, DES 和 RERG 至 少有5个连接节点通过PPI网络与其他蛋