QA验证中LC-MS数据自动化.docx

上传人:lao****ou 文档编号:140455 上传时间:2023-04-13 格式:DOCX 页数:1 大小:8.70KB
下载 相关 举报
QA验证中LC-MS数据自动化.docx_第1页
第1页 / 共1页
亲,该文档总共1页,全部预览完了,如果喜欢就下载吧!
资源描述

《QA验证中LC-MS数据自动化.docx》由会员分享,可在线阅读,更多相关《QA验证中LC-MS数据自动化.docx(1页珍藏版)》请在第一文库网上搜索。

1、摘要:AZ公司现有LC-MS平台可自动化处理数据,但只有33.8%的分析可以自动完成,剩余的部分仍需专家自行注释。目前已有700,000已完成分析注释的图谱数据,给用数据挖掘分析这些数据,达到自动化分类目的带来机会。作者最终利用Pipeline Pilot生成了 10棵树的随机森林模型,该模型将需要手动复验的数据降低了36.4%,使得公司每年节省了4万5千美元,并将工作量由之前的每月25000份分析提高到了 45000/月。DS QSAR:定量构效关系研究工具。可以计算接近千种与生物活性或ADME性质相关的描述符,包括分子拓扑描述符、分子指纹在内的一系列基本性质。同时可以调用半经验量子力学程序

2、VAMP计算与电子相关的描述符。还提供了多种统计工具,如Bayesian模型、多元线性回归、偏最小二乘法等,用于对各种复杂数据进行建模和数据挖掘。QA验证中LCMS数据自动化ref: J Lab Autom. 2016 Dec;21 (6):743-755 ; IF=2.632链接:10.1177/2211068215620765.AZ公司现有LC-MS平台可自动化处理数据,但只有33.8%的分析可以自动完成,剩余的部分仍需专家自行注释。目前已有700,000已完成分析注释的图谱数据,给用数据挖掘分析这些数据,达到自动化分类目的带来机会。作者利用现有数据,对数据进行了归一化,加入辅助参数get

3、_closet_peak,生成了多种机器学习模型,涉及决策树、支持向量机、神经网络、随机森林等,最终由Pipeline Pilot生成了 10棵树的随机森林模型表现最佳。该模型将需要手动复验的数据降低了 36.4%,使得公司每年节省了 4万5千美元,并将工作量由之前的每月25000份分析提高到了 45000/月。Table 3. Tree Complexity and Performance Using Different Pruning Methods.1ModelAccuracy (%)PrecisionRecallF-MeasureROC AreaKappaFPRateFN RateH8

4、96.110.9650.9610.9620.9570.84850.0350.064ADTree91.420.9440.9140.9220.9740.71270.0960.022NBTree96.630.970.9660.9670.990.86850.0320.046LMT96.740.9710.9670.9680.9910.87280.0310.043ZeroOne85.950.7390.860.7950.5001SMO95.990.960.960.960.9130.83280.0220.151Multilayer85.9507390.860.7950.5001REPTree96.370.96

5、50.9640.9640.9410.8550.0280.085DecisionScump94840.9490.9480.9490.9020.78980.0330.163NaiveBayes89.180.9340.8920.9030.9710.65340.120.035RF (S trees)98.980.990.990.990.9960.9S930.0 II0.004RF (10 trees)99.020.9910.990.990.9970.96060.0 II0.001RF (20 trees)99.080.9910.9910.9910.9970.9630.0 II0RF (50 trees

6、)99.090.9910.9910.9910.9980.96320.0110receiver operating charactensocT = feilse positive; fN = /alse negative; coccy prningri 1 standard error pruningminNun = minimum instances per leaf node. Applying pruning methods resulted in significantly reduced tree size and complexity, except for LMT.whkh have a built-in pruning method, ft,uning alio increased overall accuracy, generally with a smdl reduction in FP rates and a small increase in FNrates.图一各机器学习模型的统计学评价数据(红框里是由PP生成的模型)MaXFIow生物医药智能创新平台,由创腾科技自主研发,旨为不同领域的一线创新科技工作者提供一个合作共享的B-S架构平台。以“数据自由,模型自由”为理念,在结构模型与预测模型进行融合的基础上,实现模拟与AI需求的合并,为研发赋能。】

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 应用文档 > 汇报材料

copyright@ 2008-2022 001doc.com网站版权所有   

经营许可证编号:宁ICP备2022001085号

本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有,必要时第一文库网拥有上传用户文档的转载和下载权。第一文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知第一文库网,我们立即给予删除!



客服