《第48讲 数据分析——一元线性回归模型及其应用.docx》由会员分享,可在线阅读,更多相关《第48讲 数据分析——一元线性回归模型及其应用.docx(13页珍藏版)》请在第一文库网上搜索。
1、第48讲数据分析一元线性回归模型及其应用链教前二芬固本回归本源修断为先整合为主激活思维1 .工人月工资M单位:元)依劳动生产率M单位:千元)变化的线性回归方程为y=60+90x,下列判断正确的是()A.劳动生产率为1千元时,工资为50元B.劳动生产率提高1千元时,工资提高150元C.劳动生产率提高1千元时,工资约提高为90元D.劳动生产率为1千元时,工资为90元A.17.4C.0.62 .给出两组数据X,y的对应值如下表,若已知羽),线性相关,且线性回归方程为y=+Zu-,经计算知/?=1.4,则。的值为()X45678y1210986B.-1.743 D.-0.64 .对变量y有观测数据(即
2、,W(i=1,2,,10),得散点图如图,对变量,。有观测数据(如,v)(f=1,2,10),得散点图如图.由这两个散点图可以判断()y3025.20*15*io.5OI2?4S67X605040.20IOO1234567/(2)A.变量X与y正相关,B.变量X与y正相关,C.变量尢与y负相关,D.变量X与y负相关,(第3题)与。正相关与0负相关与。正相关与。负相关4.某商家今年上半年各月的人均销售额(单位:千元)与利润率统计表如下:月份123456人均销售额658347利润率()12.610.418.53.08.116.3根据表中数据,下列说法正确的是()A.利润率与人均销售额成正相关关系B
3、.利润率与人均销售额成负相关关系C.利润率与人均销售额成正比例函数关系D.利润率与人均销售额成反比例函数关系5 .某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验.根据收集到的数据(如下表),由最小二乘法求得回归方程y=0.67x+54.9.零件数“个1020304050加工时间y/min62758189现发现表中有一个数据看不清,请你推断出该数据的值为知识聚焦6 .变量间的相关关系(1)常见的两变量之间的关系有两类:一类是函数关系,另一类是相关关系.与函数关系不同,相关关系是一种非确定性关系.(2)从散点图上看,点散布在从左下角到右上角的区域内,两个变量的这种相关关系
4、称为,点散布在左上角到右下角的区域内,两个变量的这种相关关系称为.7 .线性回归方程(1)最小二乘法求回归直线,使得样本数据的点到它的的方法叫做最小二乘法.(2)回归方程方程y=1+。是两个具有线性相关关系的变量的一组数据3,y),(及,力),(w)的回归方程,其中8是待定参数.rnZ(Xi-x)(yi-y)ZXiyi-nxyi=1i=b=,Jn-n-Z(Xi-x)2Xx?-nx2i=1i=1-a=y-bx.注:回归直线y=Ax+。必过样本点的中心(x,y),这个结论既是检验所求回归直线方程是否准确的依据,也是求参数的一个依据.根据回归方程计算的;,值,仅是一个预报值,不是真实发生的值.8 .
5、回归分析(1)定义:对具有的两个变量进行统计分析的一种常用方法.(2)样本点的中心:对于一组具有线性相关关系的数据(汨,y),(X2,(,y),其中(,y)称为样本点的中心.(3)相关系数:(xi-)(yi-y)i=1(xi-)2(yi-y)2i=1i=1ZXiyi-nXyi=1当DO时,表明两个变量;当XO时,表明两个变量.的绝对值越接近于1表明两个变量的线性相关性.的绝对值越接近于0,表明两个变量之间.分类解析目标1两个变量间的相关关系(1) (2023.郴州期末)在各散点图中,两个变量具有正相关关系的是(2)(3) (2023.吉安期末)(多选)在下列各图中,两个变量具有相关关系的图是(
6、2023福田期中)如图所示,图中有5组数据,去掉组数据后(填字母代号),剩下的4组数据的线性相关性最大.(变式)目标2线性回归方程及其应用(2023烟台期中)某水果经销商为了对一批刚上市水果进行合理定价,将该水果按事先拟定的价格进行试销,得到一组销售数据,如下表所示:试销单价M元/公斤)1617181920日销售量M公斤)1681461209056(1)已知变量X,y具有线性相关关系,求该水果日销售量M单位:公斤)关于试销单价M单位:元/公斤)的线性回归方程,并据此分析销售单价x16,20时,日销售量的变化情况;(2)若该水果进价为每公斤15元,预计在今后的销售中,日销售量和售价仍然服从中的线
7、性相关关系,该水果经销商如果想获得最大的日销售利润,此水果的售价MXN)应定为多少元?55参考数据及公式:x?=1630,y=116,NXiyi=1。160,线性回归方程yi=1i=1nnZxiyi-nXyZ(Xi-X)(yi-y)1=j=J-=bxa,b=,a=ybx.x?-nx2Z(Xix)2i=1i=1变式(2023温江月考)“关注夕阳,爱老敬老”,某企业从2012年开始每年向敬老院捐赠物资和现金,下表记录了该企业第%年(2012年是第一年)捐赠的现金数y(单位:万元):X3456y2.5344.5(1)在如图所示的坐标系中,作出数据的散点图;A(2)由表中数据,求出y关于X的线性回归方
8、程y=bx+;(3)预测2023年捐赠的现金大约是多少万元;附:回归直线的斜率和截距的最小二乘估计公式分别为Z(Xi-X)(yiy)ZXiyinxyi=1i=1b=,a=ybX.(xi-x)2xr-nx2i=1i=1可供选用数据:32+42+52+686,3X2.5+4X3+5X4+6X4.5=66.5.目标3线性相关系数及其应用.(2023.长春四模)商务部会同海关总署、国家药监局于3月31日发布关于有序开展医疗物资出口的公告,如医疗物资出口中出现质量问题,将认真调查,发现一起,查处一起,切实维护“中国制造”的形象,更好地发挥医疗物资对支持全球疫情防控的重要作用.为了监控某种医疗物资的一条生
9、产线的生产过程,检验员每隔30min从该生产线上随机抽取一个医疗物资,并测量其尺寸(单位:cm).下面是检验员在一天内依次抽取的16个医疗物资的尺寸:抽取次数12345678医疗物资尺寸9.9510.129.969.9610.019.929.9810.04抽取次数910111213141516医疗物资尺寸10.269.9110.1310.029.2210.0410.059.95经计算得116X=讳Xi=9.97,S=Ai/1616晓,f)2=164(xr-16x2)i=1Qo.212,、/(i-8.5)218.439,xp1591.134,(xi-)(i-8.5)=-i=1i=1i=12.78
10、,其中总为抽取的第i个医疗物资的尺寸,i=1,2,3,,16.(1)求,D(i=1,2,,16)的相关系数r,并回答是否可以认为这一天生产的医疗物资尺寸不随生产过程的进行而系统地变大或变小(若M0.25,则可以认为医疗物资尺寸不随生产过程的进行而系统地变大或变小);(2)一天内抽检的医疗物资中,如果出现了尺寸在(x3s,x+3S)之外的医疗物资,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.从这一天抽检的结果看,是否需对当天的生产过程进行检查?附:样本,y)(i=1,2,的相关系数r=n(xi-)(yi-y)变式(2023新课标II)某沙漠地区经过治理,生态
11、系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据8,Wa=12,20),其中即和M分别表示第i个样区的植物覆盖202020面积(单位:公顷)和这种野生动物的数量,并计算得Xi=60,yi=1200,j=j=j=-2020-(xixA=80,Z(yiy)2=9000,Z(Xi-X)(yiy)=800.i=1i=1(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);(2)求样本M)(i=1,2,,20)的相关系数(精确
12、到0.01);(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.(xi-)(yi-y)21.414.附:相关系数r=导/(i-)2(yi-y)2h=i=1课堂评价1. (2023保定一模)恩格尔系数是食品支出总额占个人消费支出总额的比重.据某机构预测,10)个城市职工购买食品的人均支出y(单位:千元)与人均月消费支出M单位:千元)具有线性相关关系,且回归方程为y=0.4x+1.2,若其中某城市职工的人均月消费支出为5千元,则该城市职工的月恩格尔系数约为)B.64%D.55%A.60%C
13、.58%2. (2023莲湖期末)为了比较甲、乙、丙三组数据的线性相关性的强弱,小郑分别计算了甲、乙、丙三组数据的线性相关系数,其数值分别为0.939,0.937,0.948,A.甲组数据的线性相关性最强,B.乙组数据的线性相关性最强,C.丙组数据的线性相关性最强,D.丙组数据的线性相关性最强,乙组数据的线性相关性最弱丙组数据的线性相关性最弱甲组数据的线性相关性最弱乙组数据的线性相关性最弱(2023九江三模)如图是九江市2019年4月至2023年3月每月最低气温与最高气温(单位:C)的折线统计图.已知每月最低气温与最高气温的线性相关系数r=0.83,则下列结论错误的是()A.每月最低气温与最高
14、气温有较强的线性相关性,且二者为线性正相关8. 月温差(月最高气温一月最低气温)的最大值出现在10月C.912月的月温差相对于58月,波动性更大D.每月最高气温与最低气温的平均值在前6个月逐月增加4 .(2023.潍坊一模)甲、乙、丙、丁四位同学各自对y两变量的线性相关性作试验,并用回归分析方法分别求得相关系数心如下表:甲乙丙T相关系数r-0.820.780.690.87则哪位同学的试验结果体现两变量有更强的线性相关性?()A.甲B.乙C.丙D.T5 .(多选)某运动制衣品牌为了成衣尺寸更精准,现选择15名志愿者,对其身高(单位:Cm)和臂展(单位:Cm)进行测量.图为选取的15名志愿者身高与臂展的折线图,图为身高与臂展所对应的散点图,并求得其回归方程为y=1