《人工智能基础与应用第3章 线性回归:预测未来趋势课后习题参考答案.docx》由会员分享,可在线阅读,更多相关《人工智能基础与应用第3章 线性回归:预测未来趋势课后习题参考答案.docx(3页珍藏版)》请在第一文库网上搜索。
1、第3章线性回归:预测未来趋势课后习题答案一、考考你1 .下列哪一项C不是机器学习必备的一个要素。A.样本数据B.模型C.目标标签D.算法2 .监督学习与无监督学习最大的区别是反。A.先验知识B.学习算法C.学习方法D.有无标签3 .线性回归模型要解决的问题是旦。A.找到自变量与因变量之间的函数关系C.数据与时间的变化关系4 .梯度下降法的目标是A.尽快完成模型训练C.提供算法效率B.模拟样本数据曲线D.尽量用-条直线去拟合样本数据B.寻找损失函数的最小值D.提高模型性能5 .哪项D不是DataFrame在数据处理方面广泛应用的主要优势。A.支持多类型数据B.检索数据灵活C修改数据方便D.优于矩
2、阵运算二、亮一亮1 .采用哪些方案可有效提高预测房屋价格模型的质量,请尝试并验证你的想法。参考答案:可以考虑采用以下措施:(1)增加模型训练样本的规模;(2)增加描述房屋的特征维度;(3)尝试调节模型参数。2 .为什么要进行模型的训练、测试和评价?请讨论并阐述你的理由。参考答案:你可以把机器想象成一个小孩子,你带小孩去动物园玩,去认识动物园里的很多动物。简单起见,我们先考虑二元分类问题,你告诉小孩这个动物是狗,那个也是狗。但突然一只猫跑过来,你告诉他,这个不是狗而是猫,久而久之,小孩就会产生认知模式,这个学习过程就叫“训练”,所形成的认知模式就是“模型”。多次训练之后,若这时再跑过来一个动物,
3、你问小孩,这个是狗吗?他回答是或否,这个就叫“测试”,而小孩不一定每次都能正确识别你指向的动物,因此你需要评估这个训练的模型的有效性,并不断纠正小孩的错误回答,强化这个训练的模型有效性,这个就叫“评价”。由以上分析不难看出,我们只有训练出模型并经过大量样本的测试,经评价指标的评判证明了这个模型的有效性后,才可以真正将这个模型应用于生活和工作中的实用场景。三、帮帮我1.请尝试采用随机梯度下降回归SGDRegressor模型来预测投保人医疗费用,将预测效果与案例2进行对比。提示:用以下语句导入SGDRegressor类。fromsk1earn.1inear_mode1importSGDRegres
4、sor参考答案:# 用随机梯度下降回归SGDRegreSSOr模型预测医疗费用%map1ot1ibin1ineimportnumpyasnpimportpandasaspdimportmatp1ot1ib.pyp1otaspitfromsk1earn.1inear_mode1importSGDRegressorfromsk1carn.preprocessingimportMinMaxSca1erimportjob1ibfromsk1earn.mode1_se1ectionimporttrain_test_sp1it# 数据的加载与处理df=pd.read-csv(datainsurance.c
5、sv,header=O)df.1ocdfsex,=fema1esex=0df.1ocdfsex,=ma1e,sex,=1df.1ocdf,smoker,=yessmoker,=1df.1ocdf,smoker,=no,smoker,=0df.1ocdfregion=,southwestregion,=1df.1ocdf(region1=,southeast,region=2df.1ocdf,region,=northwest,region=3df.1ocdfregion,1=,northeast,region=4ScaIer=MinMaxSca1erOsca1er,fit(df)samp1e_
6、data=sca1er.transform(df)train_data=samp1e_data:0,1,2,3,4,5train_target=samp1e_data:,6x_train,x_test,y_train,y_test=train_test_sp1it(train_data,train_targe1,tesi_size=0.3)# 训练模型和输出训练结果mode1=SGDRegressorOmode1.fi1(x_train,y_train)score=mode1.score(x_test,y_test)intercept=mode1.intercept_coef=mode1.co
7、ef1prin1(coef)PrintC模型准确性得分3f%score)func-1R=y=%.6f%interceptforiinrange(0,coef.size):func.1R+=(%+.6fx%d,%(coei,i)print(func_1R)运行结果:O.11823967-O.001206480.063623190.021944630.30677670.00915631模型准确性得分0.731y=0.046058+0.118240x0-0.001206x1+0.063623x2+0.021945x3+0.306777x4+0.009156x5# 绘制拟合曲线y_pred=mode1.predic1(x_test)p1t.rcParamsfont.sans-serif=SimHeip1t.figure(figsize=(8,4)p1t.p1ot(y_test,y_pred,og,1abe1-MS:VS预测试)P11PIOt(y_tes1y_test,TJabe1=真实值)PIEabe1C真实值)P11y1abdC预测值,)p1t.1egend(1oc-upper1eft*)运行结果: