《SAS论文_统计分析与应用.docx》由会员分享,可在线阅读,更多相关《SAS论文_统计分析与应用.docx(10页珍藏版)》请在第一文库网上搜索。
1、SAS统计分析与应用学号:XXXXXXXX班级:XXX姓名:XXX第一章摘要2第二章:基本介绍32.1 研究目的42.2 采用方法42.3 理论知识.4第三章数据预处理及具体模型43.1 建立的数据集43.2 主要程序.4第四章计算结果及分析44.1使用INSIGHT模块做主成分分析的步骤74.2主成分的结果分析7第五章总结分析8第六章参考文献8第七章附录9SAS系统是世界公认的权威性统计软件之一,是一个大型集成信息分析管理系统。本次论文是用SAS系统对2007各地区农村居民家庭平均每人现金现金支出状况进行分析采用的数据是北京、天津等省农村居民家庭平均每人现金现金支出状(原始数据见附录)。选出
2、31省的情况作为统计分析数据,其中分析的项目为:期内现金支出、生产费用支出、家庭经营费用支出、农业生产支出、牧业生产支出、购买生产性固定资产支出、税费支出、生活消费现金支出、财产性支出、转移性支出,次用变量XI、X2、X3、X4、X5、X6、X7、X8、X9、X1O0运用SAS软件,运用主成分分析的方法对数据进行处理:(一)对于所选取的统计数据用MEANS过程进行简单描述统计分析,得出数据平均值、数据标准差等。(二)对于所选取的统计数据用INSIGHT模块做主成分分析计算协方差矩阵的特征值或是计算相关系数矩阵的特征值(EigenVaIUe)、简单统计量、相关系数矩阵、相关系数矩阵的特征值以及相
3、关系数矩阵的特征向量。系统默认计算相关系数矩阵的特征值和特征向量。(H)由相关系数矩阵的两个最大特征值的特征向量,可以写出第一、第二主成分以及第三主成分的得分。从以上结论分析可以知道影响各地区地区农村居民家庭平均每人现金支出的主要因素,从、可以更好的帮助国家调节国民经济和产业结构,使人民的生活更加富裕。关键字:主成分分析、简单统计、相关系数矩阵、相关系数矩阵的特征值及特征向二、基本介绍1、研究目的:通过SAS软件的分析,对各地区农村居民家庭平均每人现金支出的主要影响因素有一个大致的了解;有利于国家的宏观调控,从而可以促进全民经济更好的发展。2、采用方法:描述统计量:MEANS检验:使用INSI
4、GHT模块主成分分析。3、理论知识:MEANS过程(均值过程)用于对数值型变量产生针对单个变量的简单描述性统计.procmeans过程统计量参数缺省时输出N(样本数据)、Mean(数据平均值)、StdDev(数据标准差)、Minimum(最小值)、Maximum(最大值)五种统计值,但means过程可计算16种统计量。主成份分析(PrinCiPa1ComponentsAnaIySiS)是研究如何将多个变量指标间的问题化为较少的几个新指标问题。这些新的指标是彼此既互不相关,又能综合反映原来多个指标的信息,是原来多个指标的线性组合。多指标的主成份分析常被用来寻找判断某种事物或现象的综合指标,并给综
5、合指标所蕴藏的信息以恰当解释,以便更深刻地揭示事物内在的规律。这种处理问题的方法就称为主成份分析或主分量分析,综合后的新指标则称为原来指标的主成份或主分量。主分量分析还可用于揭示变量间的共线性。三、数据预处理及具体模型:对于数据较少的程序可以用DATA步创建永久SAS数据集。永久SAS数据集,由定义逻辑库与定义数据集两个步骤完成。逻辑库定义通过1IBNAME语句完成,数据集定义应用DATA实现。1IBNAME语句语法格式:1IBNAME逻辑库名称,子目录路径,;DATA语句语法格式:DATA逻辑库名.数据集名称;1IBNAME语句把磁盘中的子目录与用户定义的逻辑库名连接起来。用此种方法根据己知
6、的数据就可以建立生成以下的数据集3.1Obs建成的数据集为:areaTheSASSystem20:00x4Tuesday,December15,2009x1x2x3x5x6x7x8x9x1I北京5318.9730.2606.4124.2232.5123.71.94093.223.5470.22天津3267.81242.81172.9203.3699.569.91.21896.16.0121.63河北2289.6779.6725.0362.7226.254.63.11361.714.9130.34山西2080.9500.0441.3254.4126.358.70.71431.24.0145.15
7、内蒙古3338.71426.91223.5865.7316.6203.31.71617.352.2240.66辽宁3926.21671.21546.2719.9754.5125.03.81803.738.7408.97吉林4517.72129.91836.91404.1393.3293.15.11741.0202.9438.78黑龙江4424.62047.01812.21405.0368.8234.82.91699.1301.8373.99上海5487.1241.3229.937.332.611.40.14616.71.4627.610江苏3412.9632.1561.8236.1137.57
8、0.312.82438.95.5323.711浙江5437.21320.21192.4159.4724.4127.85.53587.723.7500.112安徽2390.0554.9490.7297.2116.764.26.01666.23.0159.913福建3026.0626.4566.8251.0208.159.60.72168.210.8219.814江西2199.8680.6591.7339.7160.489.04.51328.023.5163.215山东3060.9969.5842.4423.3314.6127.15.71885.716.7183.316河南2163.8583.95
9、23.9237.1228.860.00.61448.61.4129.317湖北2222.2677.5601.9266.8195.975.63.91471.34.664.818湖南2418.9555.8497.8196.7175.258.03.81587.92.8268.519广东2895.2576.3547.4171.3216.329.01.72155.69.5152.020广西1900.9697.4589.5348.5187.6107.92.91125.61.673.621海南1902.8656.1639.2324.3165.416.90.31187.22.157.122重庆1773.444
10、9.1406.3188.7172.842.82.51107.30.9213.523四川2514.5612.8533.5178.0270.779.36.11669.57.0219.124贵州1432.8412.5324.7167.7122.287.71.4846.31.0171.625云南1837.1623.0532.9277.2185.690.11.51089.96.8115.926西藏10223203.992.353.28.8111.50.2800.70.117.527陕西2261.3580.1442.6240.6128.4137.53.91496.84.6175.928甘肃1622.347
11、3.2391.2298.374.482.00.91068.24.375.729青海1753.8447.9348.0190.192.599.81.71196.57.4100.330宁夏2592.81029.8870.5406.2359.3159.30.21325.631.3205.831新疆2705.01444.41109.7813.2236.6334.71.01126.044.489.23.2、模型的具体程序:datadata1;inputarea$1-6x1x2x3x4x5x6x7x8x9x1;cards;1北京5318.9730.2606.4124.2232.5123.71.94093.2
12、23.5470.22天津3267.81242.81172.9203.3699.569.91.21896.16.0121.63河北2289.6779.6725.0362.7226.254.63.11361.714.9130.34山西2080.9500.0441.3254.4126.358.70.71431.24.0145.15内蒙古3338.71426.91223.5865.7316.6203.31.71617.352.2240.66辽宁3926.21671.21546.2719.9754.5125.03.81803.738.7408.97吉林4517.72129.91836.91404.1393.3293.15.11741.0202.9438.78黑龙江4424.62047.01812.21405.0368.8234.82.91699.1301.8373.99上海5487.1241.3229.937.332.611.40.14616.71.4627.610江苏3412.9632.1561.8236.1137.570.312.82438.95.5323.711浙江5437.21320.21192.4159.4724.4127.85.53587.723.7