《基于主成分分析及GALM的水产养殖环境溶解氧和氨氮含量预测.docx》由会员分享,可在线阅读,更多相关《基于主成分分析及GALM的水产养殖环境溶解氧和氨氮含量预测.docx(17页珍藏版)》请在第一文库网上搜索。
1、摘要:为了精准预测水产养殖过程中最重要的两个环境参数溶解氧和氨氮,针对预测模型需要解决的有效影响因子确定、预测算法和网络结构优化等问题,将1evenberg-Marquardt(1M)神经网络、遗传算法(genetica1gorithm,GA)和主成分分析(PCA)算法相结合,提出一种基于GA-1M-PCA的水产养殖环境溶解氧和氨氮含量预测模型,即采用PCA确定影响因素,实现影响因素的去耦合降维,采用遗传算法对网络结构进行优化,确定合适的隐层节点数目和权值,采用1M训练神经网络,提高神经网络的收敛速度。为了验证GA-1M-PCA的预测效果,将GA-1M-PCA的预测效果与未用PCA方法的GA-
2、1M预测模型进行了试验比较,并探讨了影响因素数量对预测效果的影响。结果表明:用GA-1M-PCA方法预测的溶解氧和氨氮值与实测值吻合较好,平均绝对误差和均方根误差分别为0.0047、1.8727X10(溶解氧)和0.0065、9.4287X10,(氨氮),适用于影响因素数量较多的场合。研究表明,GA-1M-PCA是一种有效的水产养殖环境溶解氧和氨氮预测工具,尤其对于影响因素复杂繁多的非线性系统效果更好。关键词:溶解氧;氨氮;水产养殖环境;遗传算法(GA);1M神经网络算法;主成分分析(PCA)水产养殖是一个包括多参数的复杂过程。其中,溶解氧(disso1vedOXygen,DO)和氨氮含量是决
3、定水产养殖产量的重要因素,DO过高或过低都会导致养殖生物死亡,氨氮直接反映养殖水质的污染程度,过高直接影响养殖生物的生存状态。因此,在水产养殖环境中对二者进行预测,对水产养殖业具有重要的意义。DO和氨氮含量的预测均为非线性问题,二者受多种因素影响,且各因素之间存在复杂的耦合关系,因此,难以利用统计的方法建立准确的预测模型,故而以神经网络和支持向量机(SUPPOrtvectormachine,SVM)为代表的非线性问题解决工具,被研究者应用于Do和氨氮预测。但是,SVM和误差反向传播神经网络(backpropagationneura1network,BPNN)具有极大的局限性,易引入冗余数据,且
4、针对复杂问题的泛化能力受到一定的制约。神经网络的结构很多都是通过试凑法来实现,导致运行费时。另外,DO和氨氮影响因素复杂,且相互之间存在很大的耦合性,很难确定神经网络的最佳输入,若将相关的影响因素全部直接引用,不仅会引入大量冗余数据,而且会由于多重共线性降低网络的训练速度和效率,影响预测精度。1evenberg-Marquardt(1M)神经网络算法利用高斯-牛顿法可以在最优值附近产生一个理想的搜索方向,从而保持较快下降速度的特点,使网络能够有效收敛,可以大大提高网络的收敛速度和泛化能力。遗传算法(genetica1gorithm,GA)是一种模拟自然进化、搜索最优解的方法,适合用来优化神经网
5、络的结构。主成分分析(PrinCiPa1componentana1ysis,PCA)方法一方面可以通过提取正交的各主成分,有效避免多重共线性,提高参数估计的准确性;另一方面可以对包含较多变量的影响因子数据集进行降维,使尽可能少的变量包含尽可能多的信息,从而使模型所包含的信息更丰富,建模更有效。基于以上考虑,本研究中构建了一个综合GA,1M和PCA算法优点的GA-1M-PCA水产养殖环境DO和氨氮含量预测模型,利用PCA算法确定DO和氨氮含量预测模型的有效影响因子,利用1M算法训练神经网络,利用GA优化神经网络结构,以期为水产养殖重要环境因子的预测提供有效工具。1基于GA-1M-PCA的预测模型
6、11水产养殖环境DO和氨氮的影响因素分析影响水产养殖环境DO含量的因素复杂,主要包括水体温度、水体含氮量和空气中氧气组分的分压力等,其中一些因素在一定条件下对某一具体养殖环境和测量点可以认为是不变的。影响水产养殖环境氨氮含量的因素主要有水温、pH、DO和电导率等,其中水温、PH越高,氨氮的毒性就越大,Do也直接关系到氨氮、亚硝酸氮和硝酸氮之间的转化效果,电导率能体现养殖环境中离子的量。本研究中,水产养殖水样采集自大连獐子岛股份有限公司养殖基地。综合考虑各变量的可测性,选取水温、盐度、叶绿素a、电导率、浊度、风速、亚硝酸盐、氨氮和总氮9个变量作为Do的影响因素;初步选取水温、pH、DO和电导率4
7、个变量作为氨氮的主要影响因素,在考虑多因素分析时,选取水温、盐度、叶绿素a、电导率、浊度、风速、亚硝酸盐、DO、PH和总氮10个变量作为氨氮的影响因素。采用浮标在线监测水温、盐度、叶绿素a、电导率、浊度、风速,采用多参数水质监测仪(YSI600X1M,美国)现场测定亚硝酸盐、pH、氨氮和Do含量,采用全自动总氮分析仪测定总氮含量(I1500,美国HACH公司)。1.2水产养殖环境DO和氨氮含量预测模型GA-1M-PCA的建从大连獐子岛股份有限公司2011-2012年所收集的监测数据中选取其中的1200组作为建模数据,其中,1100组作为训练样本,100组作为测试样本。用PCA确定养殖环境DO和
8、氨氮有效影响因子的基础上,采用GA-1M方法进行预测。预测流程图如图1所示。图1基于GATN-PCA模型的水产养殖环境Do和氨氮含量预测流程图Fig.1F1owchartofdisso1vedoxygen(DO)andammonianitrogenconcentrationsinaquacu1tureenvironmentbasedonGA-1M-PCApredictionmode11.2.1基于PCA算法的水产养殖环境DO和氨氮有效影响因子的确定考虑到水产养殖环境DO和氨氮含量影响因素众多,且相互之间存在着多重共线性,利用主成分分析方法确定DO和氨氮含量的有效影响因子,从而达到去耦合降维的效
9、果。具体步骤如下:1)对水产养殖环境DO和氨氮的影响因素进行标准归一化,以消除不同影响因子数值的平均值和方差大小对变量比较产生的影响。计算公式为j一(1jmean)1O./1、xi=;,=1,2,,A。(1)oi)其中:X为每个样本的第/个影响因素;Xe为影响因素的平均值;O(X)为影响因素的标准差。2)求样本协方差矩阵,即Cov(jI*X*)CV电导率/浊度/风速.亚硝酸拉.MM/总氮/smnp1cmScm,)NTU(ms,)rMI.(m1,)(mgI.,)No.temperaturesa1initych1orophy11ae1ectrica1conductivityturbiditywin
10、dspeedNO7-Nammonianitrogentota1nitrogen10.4605-1.20929.43380.21032.41900.4424-0.0744-0.6604-0.50262-0.72540.57533.2944-0.68323.26711.1668一0.07440.38390.23403-0.5464-O.44615.8310-0.71615.92241.7100-1.38810.1075-0.762610990.3403-1.7993-0.0610-0.0693-0.1389-0.1612-13005-0.3532-0.675911000.35571.94210.06070.()883-0.13621.064I0.07680.5806对应的水产养殖环境DO样本的协方差见表2,DO的9个影响因素之间具有一定的耦合性,需要去耦。利用GA-1M-PCA模型对DO含量进行预测,得到如表3所