《Python数据分析试题题库(含答案).docx》由会员分享,可在线阅读,更多相关《Python数据分析试题题库(含答案).docx(4页珍藏版)》请在第一文库网上搜索。
1、python数据分析自测试卷2一、选择题1 .下面关于线性回归的说法不正确的是().A.相关关系的两个变量是非确定关系B.散点图能直观地反映数据的相关程度C.回归直线最能代表线性相关的两个变量之间的关系D.散点图中的点越集中,两个变量的相关性越强2 .下列关于一元线性回归分析的说法中,不正确的是()A.最小二乘法基本原则是对于确定的方程,使观察值对估算值偏差的平方和最小B.利用回归模型进行预测,需要对回归系数、回归方程进行检验,以判定预测模型的合理性和适用性C.检验方法有方差分析、相关检验、t检验等D.对于一元线性回归,各种检验方法的检验结果是不一致的3 .回归分析中通常采用最小二乘法,下列关
2、于最小二乘法的说法错误的是OA.从理论上讲,最小二乘法可获得最佳估计值B.最小二乘法通过平方后计算得出的较大误差赋予了更大的权重C.计算平方偏差和要比计算绝对偏差和难度大D.最小二乘法提供了更有效的检验方法4 .获取2017至2018年的数据,下列代码正确的是()A.df1,2017,2018JB.df2017V2018JC.df1,2017-,20181D.df1,2017,+,2018,5 .按F1期显示数据,使用下列哪种方法()A. to-exce1()B. to-period()C. read-exce1()D. setjndex()6 .按季度统计数据,下列正确的是()A.df1.r
3、esamp1e(w,).sum()B. df1.resamp1e(m).sum()C. df1.resamp1e(A,).sum()D.df1.resamp1e(,Q).sum()7 .设置索引使用哪种方法。()A、merge()方法B、ConCaI()方法C、IoJateiimeO方法D、Se1index()方法8 .关于散点图,下列说法正确的是()A.可呈现变量的频数分布9 .可表示两种现象问的相关关系C.可描述变量的变化趋势D.可直观表示出各指标的位置10 fit方法的作用是()A.获取回归系数B.获取截距C.预测y值D,拟合线性模型10.当你遇到下面的问题时,你如何处理?()#7我计投
4、入60000元广告费x0s60000EK测7二售收入(y).y=br*kprint(y):使川战性模型进行预测y(ftyPred=c1f.predict(x)图&字体为华支细T.尸,:为10pit.rc(font.fami1y-SimHei,.HHTo)pit.figured)A.调试程序B.修改SiZe参数值C.逗号修改为英文逗号D.修改fami1y参数二、填空题1 .线性回归包括和。2 .回归分析一般使用c3 .线性回归公式是04 .df1.resamp1e(,AS,).sum(),这段代码中,AS是。5 .每个季度第一天作为开始日期,resamp1e()方法中的参数应该是三、简答题1St
5、ii-2018年1月1日至2018年5月1日广告费用支出情况2.假如7月份投入7.8万元广告费,现预测7月份的销售收入。选择题答案1.D2.D3.C4.A5.B6.D7.D8.B9.D10.C二、填空题答案1、一元线性回归、多元线性回归2、最小二乘法3、y=bx+k4、每年第一天为开始日期5、AS三、简答题答案1.统计2018年1月1日至2018年5月1日广告费用支出情况主要代码如下:bb=r,.dataJDcar.x1s,df=pd.DataFrame(pd.read_exce1(bb)df1投放日期=pd.to_datetime(df投放日期)df1=df,投放日期,支出df1=df1.set_index(投放日期,drop=True)df2=df1,2018-01-01,:2018-05-01,*按月度统计并显示广告费支出金额dfCar_month=df2.resamp1e(,M,).sum().to_periodCM,)print(dfCar_month)2.假如7月份投入7.8万元广告费,现预测7月份的销售收入。主要代码如下:x0=78000y=b+x*kprint(y)