《鉴定红曲菌中萘醌响应基因提高红曲色素产率.docx》由会员分享,可在线阅读,更多相关《鉴定红曲菌中萘醌响应基因提高红曲色素产率.docx(10页珍藏版)》请在第一文库网上搜索。
1、鉴定红曲菌中蔡醍响应基因提高红曲色素产率红曲色素是由红曲菌(也称红曲霉)(Monascusspp.)合成的一类次级代谢产物作为天然食用色素,在我国以及东南亚地区使用至今已有1 000多年历史3。近年来,红曲色素以其着色自然、健康无毒以及色调温和等特点,成为国内销量较高的天然食用色素之一,并出口到欧美等发达国家4。目前红曲色素生产菌株的产率仍不能完全满足工业生产需要。因此,提高红曲菌产率仍是本领域中的核心课题前期研究发现,蔡醍化合物能够促进红曲菌合成红曲色素7,如果能够找到红曲菌中响应蔡配化合物的基因,将有可能利用蔡醍化合物提高红曲色素产率。然而,目前红曲菌的蔡醍响应基因仍未见报道7。随着转录组
2、学与人工智能的发展,已有报道可以借助这2种工具来挖掘目标基因8-9。人工智能是一种利用不同计算机算法来进行数据学习,得到描述生物等过程模型的预测方法10。近年来发展起来的人工神经网络(artificial neural network, ANN)模型,能够较为精确地描绘微生物中基因与表型之间的内在关系,用于挖掘参与特定生物过程的关键基因8-10。本研究首先利用转录组方法初步筛选了 M. ruberM7菌株中参与紫醍响应的基因,然后选择并优化得到ANN模型,借此预测出2个可能性最高的蔡晶响应基因,利用基因敲除菌株验证mga2基因是蔡晶响应基因,以期利用白花丹配诱导mga2基因过表达菌株获得较高的
3、红曲色素产率。1材料与方法1.1 材料与试剂MonascusruberM7(CCAM 070120,Culture Collection of StateKey Laboratory of Agricultural Microbiology)为本实验保存。红曲菌基因敲除菌株AlaeA、AmrpigB和 mga2,以及mga2基因过表达菌株M7:PSpC-mga2为本课题组前期构建并保存。蔡醍类化合物1,4-蔡醍、甲蔡酿、1,2-蔡醍、白花丹配、5-羟基T,4-蔡醍与拉帕醇,上海阿拉丁试剂有限公司。1.2 仪器与设备UV-1700型分光光度计,日本Shimadzu公司;LC-20AT高效液相色谱
4、仪,日本岛津公司。1.3 实验方法1. 3. IM. ruberM7的生物量测定将M. ruberM7接种于马铃薯葡萄糖琼脂(potato dextroseagar, PDA)斜面培养基上,在289条件下培养10 d,用无菌水洗涤斜面菌丝上的袍子,得到5X105抱子mL的袍子液。将5 mL抱子液接种到50 mL马铃薯葡萄糖肉汤(potato dextrose broth, PDB)培养基中,在28 oC,120 r/min的条件下培养。发酵第12天时,离心(5 000rmin)分离菌丝体和发酵液,冷冻干燥后称量菌丝体干质量。1.2.2 蔡醛化合物诱导发酵实验将蔡醒化合物预先溶解于二甲基亚碉(d
5、imethylsulfoxide,DMS0) o在液态发酵第5天时,将蔡醍溶液加入发酵液中,继续培养。1.2.3 红曲色素的测定取冷冻干燥的菌丝体0.1 g,研磨成细粉后加入5 mL甲醇溶液(体积分数为80%),于60 0c条件下提取胞内红曲色素1 h,12 000 r/min离心5min,弃去沉淀收集上清液。上清液用甲醇溶液(体积分数为80%)稀释到适当倍数,分别测定上清液在380、470、520 nm处的吸光度值,分别计算菌丝体中黄、橙、红色素的色价,总色价为三者之和11。色价计算如公式所示:色价二AX总稀释倍数(1)式中:A为特定波长的吸光度值。1.2.4 红曲菌总RNA的提取和转录组测
6、序选取受禁醍化合物诱导的M. ruberM7为样本,以未诱导的M. ruberM7为空白对照。采用Trizol法提取M. ruberM7的总RNA,检测RNA的0D260/0D280在L82.2,确保总RNA质量,然后利用Agilent 2100生物分析仪验证RNA样品的完整性。由微浪生物科技有限公司进行cDNA文库的构建及高通量测序,得到转录组数据。基因mga2的相对转录水平按前期所建立的实时荧光定量PCR(quantitative real-time PCR,qRTPCR)方法测定7。1.2.5 转录组分析与蔡醍响应基因预测首先根据reads长度、paired-end关系、质量值等,采用F
7、PKM法估算基因表达水平,然后对read count进行标准化,再进行假设检验概率计算,最后进行多重假设检验校正。对不同蔡醛类化合物处理的红曲菌样品,分析各样品中的转录组数据,当同一个基因的表达量在不同样品间显示出差异时,如果其假阳性率0. 05,且差异倍数3,则认为该基因在不同样品中具有显著差异表达。1.2.6 人工智能预测工智响应基因将蔡能响应基因及其对应样本的红曲色素产量信息,分别定义为输入变量。采用Autosklearn软件12,建立线性模型(linearmodels)、偏最小二乘回归(partial least squares regressionmodel,PLSR) 弹性网络模型
8、(elastic net model).随机森林模型(random forest model) ANN 模型这 5 种预测模型13。为了提高ANN的预测精度并降低计算量,通过筛选激活函数和优化器对ANN进行优化,并计算和校验ANN的预测准确率14。利用优化后的ANN预测得到蔡配响应基因,如果这些基因的贡献率95%,则认为这些基因即为蔡晶响应基因。2结果与分析2. 1蔡醛化合物提高红曲色素产率选择6种菜配化合物,以不同浓度(10、30或50 molL)分别添加到培养5d的MruberM7培养物中。1,4-蔡醍、甲蔡醍、白花丹醍和拉帕醇这4种蔡配能够显著提高红曲色素产率。其中,30 molL的白花
9、丹配效果最明显,红曲色素产率从1 131 U/mg增加到1 436Umg(图1) o HU等15也发现蔡醛化合物在低浓度下能促进M. ruberM7合成红曲色素。结果证明蔡配化合物能够促进红曲色素合成,也说明红曲菌中可能存在蔡晶响应基因。a-10 mol/L蔡醛化合物;b-30 mol/L蔡醍化合物;c50molL蔡醛化合物图1添加外源蔡醍化合物提高ruberM7的红曲色素产率Fig. 1 Improvement ofMonascuspigments yield by exogenousnaphthoquinone2.2转录组学与人工智能模型联用预测蔡醍响应基因分别测定了 1,4-蔡醍、甲蔡醍
10、、白花丹晶和拉帕醇在不同浓度条件(10、30或50 molL)处理MruberM7的转录组数据和红曲色素产率数据。采用PLS-DA对基因转录表达数据进行分析,共得到20个差异基因(表1)。其中,17个基因涉及细胞内的信号传导途径,其余3个基因分别涉及蔡醍降解途径16、麦角固醇合成途径17以及红曲色素合成途径18。表1转录组学方法预测的蔡醒响应基因Table 1 Naphthoquinone-responsive genes predicted bytranscriptomics analysis注:“ t ”代表基因表达水平提高3倍以上;“ I ”代表基因表达水平降低 1/3 以上。样品:a,
11、14NQ;b,menadione;c,plumbagin;d, lapachol为了缩小禁醍响应基因的范围,利用红曲色素产率和差异表达基因的数据,分别对 Linear PLSR、Elastic Net、Random forest 和ANN这5种人工智能模型进行了训练。平均交叉验证系数(R2)通常被认为是判断模型的预测值和实测值之间相关性的重要指标,而拟合标准差(root mean square error, RMSE)是反映模型预测值与实际测量值之间平均差距的关键参数。比较5种模型,发现ANN的R2最高,而RMSE最低(图2-a和图2-b),说明ANN能够更好地预测M. ruberM7的蔡醍响
12、应过程。目前人工智能模型中,ANN也被认为是预测生物体内复杂过程的重要工具19。尽管ANN在这些模型中较优,但该ANN模型的预测精度仅有0. 72o为进一步优化该模型(图2-d),采用激活函数来提高预测精度和降低计算量20。本研究尝试了 3种激活函数,其中LReLu表现最好,使ANN预测精度提高到0.81(图2-d)。但此时ANN仍需要较高的训练步数(25 000步)。进一步采用优化器Adam降低转录组数据中的噪声以提高拟合水平21,结果表明训练步数仅需要6 000步就能够将精度提高至0.87(图2-e)。a-不同模型的平均交叉验证系数R2; b-不同模型的拟合标准差RMSE; c-ANN模型
13、计算过程示意图;d-激活函数对ANN模型预测精度的影响;e-优化器对ANN模型预测精度与计算步数的影响图2人工智能模型的筛选以及ANN模型的优化Fig.2 Selection and optimization of ANN model利用优化后的ANN模型进一步从20个基因中预测出4个蔡配响应基因:laeA、mga2、artR和sko laeA和mga2在4种蔡醍类化合物条件下都被ANN模型预测为蔡醛响应基因。而artR和sk这2个基因却仅在一定条件下被作为蔡配响应基因(表2)o基因artR在丝状真菌中调控麦角固醇的生物合成22。基因sk是鞘磷脂生物合成途径中的关键基因,可能涉及细胞生长和发育
14、23。因此artR和sk也可能参与了 M. ruberM7的蔡醍响应过程,但需要一定的条件才能有明显表现。因此,最终选择laeA和mga2作为进一步研究对象。表2优化ANN模型预测的蔡晶响应基因Table 2 Naphthoquinone-responsive genes revealed by theoptimized ANN model2.3蔡醍添加发酵实验验证mga2基因是蔡醒响应基因为了验证laeA和mga2这2个基因中哪个是票醛响应基因,我们利用相应的基因敲除菌株进行蔡醛添加发酵实验。蔡醒诱导条件下mga2菌株的蔡醍响应显著减弱,红曲色素产率的诱导效果消失(图3-a图3-c),说明缺
15、乏mga2基因后红曲菌株无法响应蔡酿化合物。laeA菌株在蔡酿化合物诱导条件下,依然保留了一定的诱导效果(图3-d图3-f),说明laeA不是主要的响应基因。基因mga2是G蛋白中的亚基,参与G蛋白信号转导途径,因此蔡醍化合物可能激活质异三聚体G蛋白,mga2亚基则向下游传导信号,促进红曲色素合成过程24。a10 mol/L蔡醒诱导Aga2菌株;b-30 mol/L蔡醒诱导 mga2 菌株;c-50 mol/L 蔡醍诱导 Amga2 菌株;d-10 mol/L蔡能诱导AleaA菌株;e-30 umol/L蔡醒诱导AleaA菌株;f-50 mol/L蔡醒诱导AleaA菌株图3票配添加实验验证mga2基因是蔡醍响应基因Fig. 3 Identification ofmga2 as thenaphthoquinone-responsive gene by naphthoquinone feedi