《逐步回归分析.docx》由会员分享,可在线阅读,更多相关《逐步回归分析.docx(44页珍藏版)》请在第一文库网上搜索。
1、第6节逐步回归分析逐步回归分析实质上就是建立最优的多元线性回归方程,显然既实用而应用又最广泛。逐步回归分析概述1概念逐步回归模型是以已知地理数据序列为基础,根据多元回归分析法和求解求逆紧凑变换法及双检验法而建立的能够反映地理要素之间变化关系的最优回归模型。逐步回归分析是指在多元线性回归分析中,利用求解求逆紧奏变换法和双检验法,来研究和建立最优回归方程的并用于地理分析和地理决策的多元线性回归分析。它实质上就是多元线性回归分析的基础上派生出一种研究和建立最优多元线性回归方程的算法技巧。主要含义如下:D逐步回归分析的理论基础是多元线性回归分析法;2)逐步回归分析的算法技巧是求解求逆紧奏变换法;3)逐
2、步回归分析的方法技巧是双检验法,即引进和剔除检验法;4)逐步回归分析的核心任务是建立最优回归方程;5)逐步回归分析的主要作用是降维。主要用途:主要用于因果关系分析、聚类分析、区域规划、综合评价等等。2最优回归模型1)概念最优回归模型是指仅包含对因变量有显著影响的自变量的回归方程。逐步回归分析就是解决如何建立最优回归方程的问题。2)最优回归模型的含义最优回归模型的含义有两点:(1)自变量个数自变量个数要尽可能多,因为通过筛选自变量的办法,选取自变量的个数越多,回归平方和越大,剩余平方和越小,则回归分析效果就越好,这也是提高回归模型分析效果的重要条件。(2)自变量显著性自变量对因变量y有显著影响,
3、建立最优回归模型的目的主要是用于预测和分析,自然要求自变量个数尽可能少,且对因变量y有显著影响。若自变量个数越多,一方面预测计算量大,另一方面因n固定,所以一1Sq增大,即造成剩余标准差增大,故要求自变量个数要适n-1中。且引入和剔除自变量时都要进行显著性检验,使之达到最优化状态,所以此回归方程又称为优化模型。3最优回归模型的选择方法最优回归模型的选择方法是一种经验性发展方法,主要有以下四种:(1)组合优选法组合优选法是指从变量组合而建立的所有回归方程中选取最优着。其具体过程是:(1)建立变量组合的所有回归方程(2)优选回归方程首先对每一个方程及自变量均作显著性检验,优选原则:自变量全部显著,
4、剩余标准差较小,既可选得最优回归方程。2)剔除优选法剔除优选法适指从包含全部自变量的回归方程中逐个剔除不显著自变量而求得最优回归方程的优选方法。其具体过程是:(1)建立多元回归方程(2)优选回归方程剔除自变量的原则是先求取偏回归平方和最小者并作显著性检验,若不显著则剔除。终止原则是直至不显著自变量剔除完为至,而仅保留对因变量y有显著影响的自变量。3)引入优选法引入优选法是指将所有自变量经显著性检验而逐个引入对因变量有显著影响的自变量的优选方法。其具体过程是:(1)建立一元回归方程(2)优选回归方程引入原则是偏相关系数绝对值最大者,引入后并进行显著性检验,若显著则继续引进自变量,直至再无显著自变
5、量引进为止。4)逐步回归分析法逐步回归分析法是指运用回归分析原理采用双检验原则,逐步引入和剔除自变量而建立最优回归方程的优选方法。具体含义是:(1)每步有二个过程即引进变量和剔除变量,且引进变量和剔除变量均需作F检验后方可继续进行,故又称为双重检验回归分析法。(2)引入变量引入变量的原则是未引进变量中偏回归平方和最大者并经F显著性检验,若显著则引进,否则终止。(3)剔除变量剔除原则是在引进的自变量中偏回归平方和最小者,并经F检验不显著,则剔除。(4)终止条件即最优条件,再无显著自变量引进,也没有不显著自变量可以剔除,这也是最优回归方程的实质。由此可知,它并没新的理论,只是多元回归分析基础上派生
6、出的一种算法技巧。现在就来介绍逐步回归分析的具体建模原理和方法步骤。逐步回归分析的数学模型逐步回归分析的数学模型是指仅包含对因变量Y有显著影响自变量的多元线性回归方程。为了利于变换求算和上机计算,将对其变量进行重新编号并对原始数据进行标准化处理。变量重新编号1新编号数学模型令儿=“,自变量个数为kT,则其数学模型为:Xak=+xa+Pixa2+PzXa3+Pk-Xak-式中,=1,2,3,,nn:样本个数其中:s=Z(%F2=-)2SQ=S-SU=Z(%-)2S的偏回归平方和为:叉=Cii兀:为%的算术平均值bj:.的偏回归系数C2,.:为逆矩阵厂对角线对应元素2回归数学模型新编号的回归数学模
7、型为:=+Exb2x2+b3x3+.+-1xa-1标准化数学模型标准化回归数学模型是指将原始数据进行标准化处理后而建立的回归数学模型,即实质上是每个原始数据减去平均值后再除以离差平方和的方根。1标准化回归数学模型令Zaj=土三产1,2,3,,k其中:Xj=-x;Sj=瓦=j(K)2!为离差平方和的方根注意:/,历,S;,Sj它们之间的区别,即离差平方和,离差平方和的方根,方差,标准差。则回归数学模型为:ak=fi+za+iz,a2+3Za3+风-IZajtT2标准化回归数学模型的正规方程组标准化回归数学模型正规方程组的一般形式为:no+(zttk+(Zq2)6;(3)3+(Za1)瓦T=ZZQ
8、A(1k+(4)A,+(1ZaM2+(Za13)3+-+ZaIZaI)KT=ZZa1Zak(2k+(12)A,+()2+(z23)3+(22zA-1)-1=2(3)A,)+(1)Az+(22Z3)+(+ryi1+、3乖3+Git-IA1-I=r3k。,rk-+rA-I2夕2+T3夕3rk-k-Pk-=f,k-k这样,数据标准化处理后的估计值0,并令,则可得数据标准化处理后的回归方程数学模型的正规方程组的一般形式为:r+1202+r33+rk-k-rkr2,+rI1P1+r2yy+r2k-k-=r2k丫3、01+t3202+r33y+Gk-Pk-r3k-1+r-11P1+rk-303+A-IA-
9、I=7-1k这样,数据标准化后式的估计值应为0,并Q=4令,则可得:4+rnd2+r13d3+。ZdJ=/%4+r22d2+r23d3+z2*-1-1=YZ+hd+W3+-+GTd1=G4-114+rA-I22+rk-33+rk-k-k-=4-1Jt其中:rWr2rk-R=%22%称为相关系数矩阵。B=:rk-k解此方程组,即可求出4,由,4,么故可得标准化后的回归模型为:乞k=4Zd2z2+.+dk_yzk_x标准化的回归模型的矩阵形式:一4On*-nOOGrnA=XX=OG1r22标准化前后回归模型的关系1标准化前后的回归模型D标准化前后回归模型为:xk=+bxx+b2x2+b3x3+.+
10、及_吊72)标准化后回归模型为:2#=Z+d2z2+.+djkZ*2标准化前后的偏回归系数标准化前后偏回归系数的关系可从变化过程反演得知:令Zj=%/代入标准化前的回归模型可得:Sj:=dJii+d,.i11+dJJFCIU/Ca-IO“3o2ji-i整理后得:.=%+bxxx+b2x2+b3x3+.+.1x*,1将上式与标准化前的回归模型作比较,由待定系数法可知标准化前后回归模型的偏回归系数的关系为:电=显djSJ1j=1,2,3t-k-1%=%一Zb落y=于是,只要求出叫,即可求出鸟,今后仅讨论标准化后的回归模型。3标准化后的各种离差平方和SQ=蚩Sq求解求逆紧凑变换法逐步回归分析每引进和
11、剔除一个变量都要用到求解求逆紧奏变换法进行矩阵变换,最后求出方程组的解和逆矩阵。现介绍其变换原理和方法步骤。求解求逆紧奏变换法的基本公式由上述介绍可知,标准化后的正规方程组为:4+32+54+0Id1=/%dI+r22d2+r23d3+弓T=r2k,r3dr32d2+W3+-+=r3k7Jt-I11+rk-22+7Jt-I33+rk-k-k-=。-IJt可得增广矩阵”3由(R吗E)经高斯消元法变换为(E次T),既可求出解和相应的逆矩阵。r2r222ru-%1r2k-1r2krkk-rkk经高斯消元法变换为:(EtR-)=以,+1,k+2r(i)r2+1嘤,2+1川2*+2r(Dr22k+1吧I
12、kzJt-I*+1r()rk-1k+2.(/)rk-2k+1吧,kk+川,kk+2rk2k+1OOftftOO1O其变换公式为:(1),.(O_r(-)/r(-Drkjrkj/rkkj=1,2,3,2Z+1=小-4YFMr)ik说明:公式(1)是好理解的;公式(2)是指求算非主行和非主列的元素,实质上就是该元素减去其对应的主行与主列元素相乘并除以主元素。举例,解下列方程组:IOx1+7x2+4x3=47x1+Ix2+3x3=44x1+3x2+4x3=3解:利用上述高斯消元法的(1)(2)公式,解上述方程组的求解求逆变换过程如下:由上述方程组可得高斯求解求逆变换法矩阵形式A:107441OO77340104343001当人二1,主元素为:如,根据高斯求解求逆变换法原理和方法,可得A:-10.70.40.40.1002.10.21.2-0.7100.22.41.4-0.40OO1可得4:A=-100.333010.09500.333-0.33300.571-0.3330.476O1.286-0.333-0.0951002.381当仁3,主元素为:a33,根据高斯求解求逆变换法原理和方法,可得A:1OO-0.1810.380-0.320-0.14fA(3)=O1O0.519-0.3200.480-0.040OO10.541-0.141-0.0400.423