《成对数据的统计分析 第5课时 一元线性回归模型及其应用.docx》由会员分享,可在线阅读,更多相关《成对数据的统计分析 第5课时 一元线性回归模型及其应用.docx(16页珍藏版)》请在第一文库网上搜索。
1、8.2一元线性回归模型及其应用(3课时,单元教学设计)第一课时刘谦(安徽省淮南第一中学)第二、三课时石伟伟(安徽省寿县第二中学)1单元内容与内容解析1.1内容一元线性回归模型,一元线性回归模型参数的最小二乘估计.第一课时:一元线性回归模型.第二课时:一元线性回归模型参数的最小二乘估计.第三课时:一元线性回归模型的应用.1.2内容解析一元线性回归模型是描述两个随机变量之间相关关系的最简单的回归模型.当两个变量具有显著的线性相关关系时,可以建立一元线性回归模型来刻画两个变量间的随机关系,并通过模型进行预测.建立一元线性回归模型的基础是对成对样本数据进行相关性分析.通过散点图,直观观察相关关系的类型
2、、方向和强弱;构造相关系数,定量刻画两个变量相关的正负性和线性相关关系的密切程度.在此基础上,建立一元线性回归模型,使用最小二乘法估计参数,得到经验回归方程,进行预测.为了评价和改进模型,引入残差和残差图,以及决定系数R2对模型进行诊断,使其不断完善,帮助决策.一元线性回归模型是统计学中一种最基础且重要的模型,许多回归模型都是以一元线性回归模型为基础进行研究.其涉及的统计模型的思想、最小二乘思想、方差分析思想(构造统计量,评价回归拟合效果)在统计学中占有重要的地位.在一元线性回归模型的建立和应用过程中,通过创建回归方程、估计模型参数、分析模型有效性、将非线性回归模型转化为线性回归模型等内容的学
3、习,使学生亲力亲为、参与其中,体会统计的思想,理解统计的概念,了解统计分析的一般方法,积累数据分析的经验,增强应用意识.让学生感悟到根据实际情况进行科学决策的必要性和可能性,体会统计思维与确定性思维的差异、归纳推理与演绎证明的差异,夯实“四基”,提高“四能”,全面培养学生的数据分析、数学建模、逻辑推理、数学抽象、数学运算等数学核心素养.基于以上分析,确定本单元的教学重点:(1)一元线性回归模型的意义;(2)用最小二乘法估计回归模型参数的方法;(3)残差分析和决定系数R2的意义;(4)一元线性回归模型的应用.2单元目标与目标解析2.1目标(I)结合具体事例,了解一元线性回归模型的含义,了解模型参
4、数的统计意义,了解最小二乘原理.(2)掌握一元线性回归模型参数的最小二乘估计方法,会使用相关的统计软件进行数据分析.(3)掌握残差分析的方法,理解决定系数R2的意义.(4)针对实际问题,会用一元线性回归模型进行预测.2.2目标解析达成上述R1标的标志是:(1)知道线性回归模型与函数模型的区别,知道线性回归模型中误差e满足E(e)=O,D(e)=2的理由.(2)能依据使用距离来刻画接近程度的数学方法了解最小二乘原理,并利用该原理推导参数估计值的计算公式.(3)会使用统计软件绘制散点图,计算样本相关系数、求回归方程,能用残差、残差图和决定系数R2对回归模型进行评价等.(4)通过具体案例,理解利用一
5、元线性回归模型可以刻画随机变量之间的线性相关关系,在建立一元线性回归模型解决实际问题的过程中,提升数据分析、数学建模、逻辑推理等素养.3单元教学问题诊断分析“一元线性回归模型及其应用”与“成对数据的统计相关性”一样,都是关于定量变量进行的研究.在前一节“成对数据的统计相关性”的学习中,主要介绍了散点图和相关系数,侧重于考查变量之间相关的形态和程度,而“一元线性回归模型及其应用”侧重于考查变量之间的数量关系,展示变量之间的具体形态.因此,可以看作是在前一节基础上的进一步深入刻画.为了揭示这种数量关系,在第一节里引入回归模型这一概念,教学时要注意与函数模型的区别,体会统计思维和确定性思维的差异,这
6、也是由于统计学的学科特点决定的.统计学是建立在数据的基础上,通过演绎方式,对随机现象进行研究的科学.许多样本数据带有随机性,因此,在构建模型时,特地设置了随机误差项e,反映未列入方程的其它各种因素对y的影响,并对其均值和方差做了要求.学生们在学习随机误差时可能会存在理解困难.在第二节里,介绍了利用最小二乘原理寻求最佳拟合直线的方法,让学生体会其蕴含的最小二乘思想,认识到最小二乘法是统计分析中一种常用的数据处理方法.利用该方法对模型的参数做出估计时,学生们容易误将参数的估计值当作模型的参数,对参数的意义理解不够准确,这是由于对样本的随机性了解不够造成的.教学设计时专门设置解惑环节,消除障碍,深化
7、理解.基于以上分析,确定本单元的教学难点:(1)对随机误差的理解;(2)最小二乘的原理和方法;参数的意义及参数估计公式的推导;(4)残差变量的解释与分析;(5)模型的应用以及优度的判断.4单元教学支持条件分析一元线性回归模型主要研究两个随机变量的线性相关关系,通过成对样本数据建立模型,寻找数据背后隐藏的规律.在教学时,由于需要处理大量数据,涉及画散点图、求回归方程、画回归直线、计算残差和决定系数R2以及数据变换等等,计算量大.课标(2017年版)里明确要求“会使用相关的统计软件”.因此,在本单元教学中,需要使用GeoGebra.Exce1图形计算器等统计软件帮助处理数据.利用信息技术工具辅助教
8、学,不仅仅是教学的需要,也是现如今大数据时代,对于每个受教育者掌握必备的信息技术提出的要求.借助大数据的东风,创建信息技术高效课堂.7课时教学设计3第三课时7.1 教学内容一元线性回归模型的应用.7.2 教学目标(1)能通过具体事例说明一元线性回归模型修改的依据与方法.(2)通过对具体问题的进一步分析,能将某些非线性回归问题转化为线性回归问题并加以解决,提高数学运算能力.(3)能通过事例说明R2的意义和作用,提高数据分析能力.7.3 教学重点与难点教学重点:一元线性回归模型的修改,将非线性回归问题转化为线性回归问题,决定系数R2的意义和作用.教学难点:运用适当的变换将非线性相关问题转化为线性相
9、关问题,用决定系数R2判断模型的优度.7.4 教学过程设计7.4.1复习回顾引导语:上一节课我们一起学习了一元线性回归模型参数的最小二乘估计,学会使用数学的方法一一距离,来刻画点与直线的接近程度,体会最小二乘原理,掌握一元线性回归模型的最小二乘估计方法,能推导出回归模型中参数的估计值公式.我们还学习了残差和残差图,借助残差分析,对模型进行评价.下面我们再通过一道例题,复习回顾解决线性回归问题的具体流程.例1.经验表明,对于同一树种,一般树的胸径(树的主干在地面以上1.3m处的直径)越大,树就越高.由于测量树高比测量胸径困难,因此研究人员希望由胸径预测树高.在研究树高与胸径之间的关系时,某林场收
10、集了某种树的一些数据如下表所示,试根据这些数据建立树高关于胸径的经验回归方程.表1编号123456胸径/cm18.120.122.224.426.028.3树高/m18.819.221.021.022.122.1编号789101112胸径/cm29.632.433.735.738.340.2树高/m22.422.623.024.323.924.7师生活动:教师让学生上讲台,合作演示使用GeOGebra统计软件,自主解决问题的全过程,必要时教师加以适当的引导.其余学生通过师生互动平台观摩、学习他们的学习成果,总结、归纳使用GeoGebra统计软件,解决线性回归问题的一般步骤,具体如下:(1)确定
11、研究对象,明确哪个变量是解释变量,哪个变量是响应变量.(2)画出解释变量与响应变量的散点图,观察它们之间的关系(如是否存在线性关系等).(3)根据散点图及相关系数,结合经验,确定经验回归方程的类型.(4)按一定规则(如最小二乘法)估计经验回归方程中的参数,建立经验回归方程.(5)对结果进行残差分析.操作方法如下:(1)在GeoGebra表格区的B、C两列分别输入树的胸径和数高的观测数据.(为方便讲解,设置A列为样本数据的编号,第一行为相关数据的表示说明)(2)鼠标左键同时选中B、C两列,点击工具栏中的第2个图标的倒三角下拉标志,选择“双变量回归分析”,出现“数据源”的对话框,点击“分析”,出现
12、“数据分析”区,位于“散点图”一栏下,出现了成对样本数据的散点图.观察散点图,发现散点大致分布在一条从左下角到右上角的直线附近,表明两个变量具有线性相关关系,并且是正相关,可以使用线性回归方程来近似刻画二者之间的关系.接下来继续操作软件,点击“数据分析”区工具栏的,在弹出的对话框里可以看到相关系数为0.9657,说明两个变量的相关性很强,可以建立一元线性回归模型来刻画树高与胸径之间的关系.图1(3)点击“数据分析”区的“回归模型”下方的倒三角下拉标志,选择“线性”.右边界面会弹出根据最小二乘法计算得到的经验回归方程y=Q2493x+14.8402.若以表示胸径,力表示树高,贝IJ人=0.249
13、3d+14.8402.图2(4)在表格区可以根据经验回归方程,计算出树高的预测值和相应的残差.具体操作方法:点击Q2表格,输入“=0.2493*及+14.8402”,点击“Enter”键,出现计算结果”19.35”,这是第一组样本数据对应树高的预测值.利用GeoGebra软件自带的表格计算功能,把光标移动到02单元格的右下角,当光标呈现细十字架时,按住鼠标左键下拉,依次得到其余各组数据对应树高的预测值.利用同样的方法,在硬单元格里输入“=C2-。2”,然后下拉填充,求得12个残差值,从残差表中,可以看到残差在T).65,0.78内,有6个正数,6个负数.残差表明随机误差符合一元线性回归模型的假
14、设.o*!图3(5)在“数据分析区”,选择“残差图”,便可得到残差图.由图可知,残差点比较均匀地分布在以横轴为对称轴、宽度小于2m的带状区域内,说明经验回归方程6=0.2493c/+14.8402能够较好地刻画树高与胸径之间的关系.因此,可以根据经验回归方程0=0.24934+14.8402,由树的胸径预测树高.图4问题:请同学们总结解决线性回归问题的具体流程和一般步骤:设计意图:通过复习回顾,检查学生对一元线性回归模型掌握的情况,并由此总结归纳求解经验回归方程的一般步骤.同时,了解学生使用统计软件的情况,培养学生使用信息技术的意识和初步能力,贯彻课标(2017年版)“会使用相关的统计软件”的
15、要求.统计的核心就是数据分析,让学生体会到使用统计工具可以大大提高处理数据的效率.当数据的处理不再是一个困难时,学生主动使用所学的统计方法去解决实际问题才成为可能.7. 4.2案例分析引导语:在例题1里,我们根据树高与胸径两个变量之间的线性关系,建立了一元线性回归模型进行有效预测,帮助决策.但是在实际问题中,两个变量之间的依赖关系并不总是以线性的形式表现出来,可能是非线性的,比如指数相关或对数相关等非线性相关关系,那么就需要我们对建立的模型进行诊断和改进,使其能够更好地反映两个变量间的真实关系.统计学的基本任务就是建立拟合效果更好的模型,来反映真实情境下的变量关系.但是在现实世界中,通常情况下,虽然两个变量的真实模型是客观存在的,我们也并不知道真实模型具体是什么,只能根据问题背景和已掌握的知识建立模型,来近似于这个真实的模型.接下来,我们将通过一道例题,借助于一元线性回归模型研究非线性相关的两个变量间的关系,探究寻找近似效果更好的模型的全过程.例2.人们常将男子短跑IOOm的高水平运动员称为“百米飞人”.下表给出了1968年之前男子短跑IOOm世界纪录产生的年份和世界纪录的数据.试依据这些成对数据,建立男子短跑IOOnI世界纪录关于纪录产生年份的经验回归方程.表212