R语言数据分析与挖掘(谢佳标微课版) 习题及答案chapter05.docx

上传人:lao****ou 文档编号:924730 上传时间:2024-07-26 格式:DOCX 页数:1 大小:15.17KB
下载 相关 举报
R语言数据分析与挖掘(谢佳标微课版) 习题及答案chapter05.docx_第1页
第1页 / 共1页
亲,该文档总共1页,全部预览完了,如果喜欢就下载吧!
资源描述

《R语言数据分析与挖掘(谢佳标微课版) 习题及答案chapter05.docx》由会员分享,可在线阅读,更多相关《R语言数据分析与挖掘(谢佳标微课版) 习题及答案chapter05.docx(1页珍藏版)》请在第一文库网上搜索。

1、一、多选题1 .常用的数据变换手段有(ABCD)A.产生衍生变量B.标准化变换C.连续型离散化变换D.改善变量分布的变换2 .数据清洗常用在以下方面(ABCD)A.数据不一致情况B.统一维度编码C.异常值处理D.缺失值处理3 .异常值判断及处理常用手段有(ABCDE)A.简单统计分析B.3sigma原则C.箱型图分析D.聚类分析E.1OF(局部异常因子)检测异常值4.识别缺失值常用函数有(AC)A. is.na函数B. is.NA函数C. Comp1etexases函数D. Comp1etexase函数二、上机题1.导入贷款数据accepts.csv到R中,对数据集accepts按照变量bad

2、jnd进行等比例分析,分成75%:25%两份。#导入数据accepts-read.csv(accepts.csv)#对accepts按照变量badjnd进行等比例分析,Iibrary(Caret)prop.tab1e(tab1e(accepts$bad_ind)分成75%:25%两份index-CreateDataPartition(accepts$bad_ind,timestrain-acceptsindexztest-accepts-indexzprop.tab1e(tab1e(train$bad_ind)prop.tab1e(tab1e(test$badjnd)=1,p=0.75z1ist=F)2.对缺失值模式进行探索,利用表格和可视化的方式进行展示。对缺失值模式进行查看1ibrary(mice)md.pattern(accepts)Iibrary(VIM)aggr(acceptszprop=Fznumbers=T)

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 应用文档 > 工作总结

copyright@ 2008-2022 001doc.com网站版权所有   

经营许可证编号:宁ICP备2022001085号

本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有,必要时第一文库网拥有上传用户文档的转载和下载权。第一文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知第一文库网,我们立即给予删除!



客服