《第49讲 数据分析——分类变量与列联表 (2).docx》由会员分享,可在线阅读,更多相关《第49讲 数据分析——分类变量与列联表 (2).docx(6页珍藏版)》请在第一文库网上搜索。
1、第49讲数据分析分类变量与列联表一、单项选择题(选对方法,事半功倍)1.观察下列频率等高条形图,其中两个分类变量-y之间关系最强的是()2.经过对烂的统计量的研究,得到了若干个临界值,当片42.706时,我们认为事件A与8()A.有95%的把握认为A与5有关系B.有99%的把握认为A与B有关系C.没有充分理由说明事件A与B有关系D.不能确定3.为了了解高中生作文成绩与课外阅读量之间的关系,某研究机构随机抽取了60名高中生,通过问卷调查,得到以下数据:作文成绩优秀作文成绩一般总计课外阅读量较大221032课外阅读量一般82028总计303060由以上数据,计算得到心的观测值K9.643,根据临界
2、值表,以下说法正确的是()A.没有充足的理由认为课外阅读量大与作文成绩优秀有关B.有0.5%的把握认为课外阅读量大与作文成绩优秀有关C.在犯错误的概率不超过0.001的前提下认为课外阅读量大与作文成绩优秀有关D.在犯错误的概率不超过0.005的前提下认为课外阅读量大与作文成绩优秀有关4.某市政府调查市民收入与旅游欲望时,采用独立性检验法抽取2019人,计算发现心的观测值Z-6.723,则根据这一数据,市政府断言“市民收入与旅游欲望有关系”犯错误的概率不超过()A.0.005B.0.05C.0.025D.0.015. (2023新乡二模)某学校食堂对高三学生偏爱蔬菜还是肉类与性别的关系进行了一次
3、调查,根据独立性检验原理,处理所得数据之后发现,有99%的把握但没有99.9%的把握认为偏爱蔬菜还是肉类与性别有关,则片的观测值可能为()P(HNAo)0.100.050.250.0100.0050.001k2.7063.8415.0246.6357.87910.828A.T2=3,206B.心=6.5616. C.心=7.869D./C2=11.2087. (2023三明调研)“十一”期间,邢台市通过随机询问100名性别不同的居民是否能做到“光盘”行动,得到了如下列联表,下列结论正确的是()做不到“光盘”行动能做到“光盘”行动男4510女3015A.在犯错误的概率不超过1%的前提下,认为“该
4、市居民能否做到光盘行动与性别有关”B.在犯错误的概率不超过1%的前提下,认为“该市居民能否做到光盘行动与性别无关”C.有90%以上的把握认为“该市居民能否做到光盘行动与性别有关”D.有90%以上的把握认为“该市居民能否做到光盘行动与性别无关”二、多项选择题(练一逐项认证,考一选确定的)7 .经过对心的统计量的研究,得到了若干个临界值,当心的观测值Q3.841时,我们()A.在犯错误的概率不超过0.05的前提下可认为A与8有关8 .在犯错误的概率不超过0.05的前提下可认为A与8无关C.有99%的把握说A与B有关D.有95%的把握说A与8有关8.两个分类变量X和K它们的取值分别C.1D.09 .
5、(2023烟台模拟)某校计划在课外活动中新增攀岩项目,为了解学生喜欢攀岩和性别是否有关,面向学生开展了一次随机调查,其中参加调查的男、女生人A.参与调查的学生中喜欢攀岩的男生人数比喜欢攀岩的女生人数多B.参与调查的女生中喜欢攀岩的人数比不喜欢攀岩的人数多C.若参与调查的男、女生人数均为100人,则有99%的把握认为喜欢攀岩和性别有关D.无论参与调查的男、女生人数为多少,都有99%的把握认为喜欢攀岩和性别有关三、填空题(精准计算,整洁表达)10 .某部门通过随机调查89名工作人员的休闲方式,了解读书和健身的人数,得到的数据如下表:分类读书健身总计女243155男82634总计325789在犯错误
6、的概率不超过的前提下认为性别与休闲方式有关系.11.为研究某新药的疗效,给100名患者服用此药,跟踪调查后得到下表中的数据:无效有效总计男性患者153550女性患者64450总计2179100设Ho:服用此药的效果与患者的性别无关,则烂的观测值小,从而得出结论:服用此药的效果与患者的性别有关,这种判断出错的可能性为四、解答题(让规范成为一种习惯)12. 为抑制房价过快上涨和过度炒作,各地政府响应中央号召,因地制宜出台了系列房价调控政策.某市拟定出台“房产限购的年龄政策”.为了解人们对“房产限购年龄政策”的态度,在年龄为2060岁的人群中随机调查100人,调查数据的频率分布直方图和支持“房产限购
7、”的人数与年龄的统计结果如图所示:(第12题)年龄120,28)28,36)136,44)144,52)52,60)支持的人数155152817(1)由以上统计数据填2X2列联表,并判断能否在犯错误的概率不超过0.05的前提下认为以44岁为分界点的不同人群对“房产限购年龄政策”的支持度有差异;44岁以下44岁及44岁以上总计支持不支持总计(2)若以44岁为分界点,从不支持“房产限购”的人中按分层抽样的方法抽取8人参加政策听证会,现从这8人中随机抽2人,求抽到的2人中恰有1人是44岁以下的概率.参考公式:(a+/?)(?+d)(a+c)(b十d)P(K2fa)0.1000.0500.0100.0
8、012.7063.8416.63510.82813. (202。信阳期末)我国新型冠状病毒肺炎疫情期间,以网络购物和网上服务所代表的新兴消费展现出了强大的生命力,新兴消费将成为我国消费增长的新动能.某市为了了解本地居民在2023年2月至3月两个月网络购物消费情况,在网上随机对IooO人做了问卷调查,得到如下表所示的频数分布表:网购消费情况/元0,2000(2000,4000(4000,6000(6000,8000(8000,10000频数3004001806060(1)作出这些数据的频率分布直方图,并估计本市居民此期间网络购物的消费平均值;(2)在调查问卷中有一项是填写本人年龄,为研究网购金额
9、和网购人年龄的关系,以网购金额是否超过4000元为标准进行分层抽样,从上述Io(M)人中抽取200人,得到如表列联表,请将表补充完整,并根据列联表判断,在此期间是否有95%的把握认为网购金额与网购人年龄有关.网购不超过4000元网购超过4000元总计40岁以上7510040岁以下(含40岁)总计参考公式和数据:X=无萧禽篝回国,其中=+b+c+d为样本容量.P(N2ko)0.0500.0100.001ko3.8416.63510.82814. 2023年2月,为防控新冠肺炎,各地中小学延期开学.某学校积极响应“停课不停学”政策,在甲、乙两班分别开展了“,G两种不同平台的线上教学尝试,经过一段时间的试用,从两班各随机调查了20名同学,得到了对两种线上平台的评价结果如下表:评价结果差评一般好评甲班5人10人5人乙班2人8人10人(1)假设两个班级的评价相互独立,以事件发生的频率作为相应事件发生的概率,若从甲、乙两班中各随机抽取一名学生,求甲班学生的评价结果比乙班学生的评价结果“更好”的概率;附:K2=(2)根据对两个班的调查,完成列联表,并判断能否有99%的把握认为评价是否“差评”与线上平台有关.差评好评或一般总计H平台G平台总计,=+b+c+4.P(M2比)0.0500.0100.0013.8416.63510.828(+0)(c+d)(+c)(b+G