R语言数据分析与挖掘(谢佳标微课版) 习题及答案汇总 chapter01 --12.docx

上传人:lao****ou 文档编号:924715 上传时间:2024-07-26 格式:DOCX 页数:15 大小:89.57KB
下载 相关 举报
R语言数据分析与挖掘(谢佳标微课版) 习题及答案汇总 chapter01 --12.docx_第1页
第1页 / 共15页
R语言数据分析与挖掘(谢佳标微课版) 习题及答案汇总 chapter01 --12.docx_第2页
第2页 / 共15页
R语言数据分析与挖掘(谢佳标微课版) 习题及答案汇总 chapter01 --12.docx_第3页
第3页 / 共15页
R语言数据分析与挖掘(谢佳标微课版) 习题及答案汇总 chapter01 --12.docx_第4页
第4页 / 共15页
R语言数据分析与挖掘(谢佳标微课版) 习题及答案汇总 chapter01 --12.docx_第5页
第5页 / 共15页
亲,该文档总共15页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《R语言数据分析与挖掘(谢佳标微课版) 习题及答案汇总 chapter01 --12.docx》由会员分享,可在线阅读,更多相关《R语言数据分析与挖掘(谢佳标微课版) 习题及答案汇总 chapter01 --12.docx(15页珍藏版)》请在第一文库网上搜索。

1、一、单选题1 .需要查看当前工作目录,可输入以下哪个函数(D)A.setwdB.setwd()C.getwdD.getwd()2 .需要查看当前环境己有对象内容,可输入以下哪个函数(D)A.IsB.1sC.1istD.Is()3 .需要查看包的安装路径,可输入以下哪个函数(OA.1ibraryPathOB.1ibrarypaths()C.1ibPaths()D.1ibrary)4 .需要在CRAN在线安装扩展包,需利用以下哪个函数(D)A.insta11.package(包名)B.insta11.package(包名)C.UPdate.packages(包名)D.insta11.package

2、s(包名”)5 .以下哪个字符不是代表逻辑值(C)A.TRUEB.TC.TrueD.FA1SE二、填空题1 .如需要删除当前环境中的所有对象,应该输入一rm(1ist=1s()2 .R中用于存储数据的对象类型有向量、矩阵、数组、因子、列表、数据框3 .R中的数据类型有数值型、复数型、字符型、逻辑型、原味型4 .查看向量长度的函数是1ength5 .查看数组维度的函数是dim三、单选题1 .遇到非结构化数据时,应该以下哪个命令将外部数据导入到R中(D)A.read.tab1eB.read.csvC.read1inesD.read1ines2 .在read.tab1e函数读入数据时,如果需跳过前面

3、N行,应该用以下哪个参数进行设置(C)A.headerB.sepC.skipD.nrows四、多选题1 .常用读取exce1函数有(ABD)A. 1s包中的read.1s函数B. X1Connect包中的IoadWorkbOOk及readworksheet函数C. read1包中read.exce1函数D. read1包中的read_exce1函数2 .常用读取CSV文件的函数有(ABCD)A.read.tab1eB.read.csvC.read_csvD.read.csv2五、上机题利用readr包的read_csv()函数和data.tab1e包的fread()函数两种方式读取本地的ccF

4、raudScore.csv数据集,赋值为CcFraudScore数据对象。#方式一1ibrary(readr)CcFraudScore-read-csv(zzccFraudScore.cs,)#方式二Iibrary1data1ab1e)CcFraudScore-fread(zzccFraudScore.csv,3六、多选题3 .用来描述连续型数据集中趋势的统计量,常用的有(ABCD)E.均值F.众数G.中位数H.百分位数1 .方差J.标准差4 .用来描述连续型数据分布的离散程度统计量,常用的有(ABCD)A.极差B.四分位距C.方差D.标准差E.峰度F.偏度七、填空题1.创建两个向量:xc(1

5、35,6,9);yx-c(15,6z9kyrbind(x,y)1D,2311415X13569y2468102.创建一个向量:zzorder(z)1236145八、上机题1.求mtcars数据集的mpg变量的最小值、最大值、求和、中位数、平均数。min(mtcars$mpg)110.4max(mtcars$mpg)133.9sum(mtcars$mpg)1642.9median(mtcars$mpg)119.2mean(mtcars$mpg)120.090622.求mtcars数据集的mpg变量的百分位数,要求求出0%,10%,20%,,90%,IO0%位置的值。quanti1e(mtcars

6、$mpgzprobs=Seq(0,1,0.1)0%10%20%30%40%50%60%70%80%90%100%10.4014.3415.2015.9817.9219.2021.0021.4724.0830.0933.90九、多选题5 .常用的数据变换手段有(ABCD)K.产生衍生变量1.标准化变换M.连续型离散化变换N.改善变量分布的变换6 .数据清洗常用在以下方面(ABCD)G.数据不一致情况H.统一维度编码1 .异常值处理J.缺失值处理7 .异常值判断及处理常用手段有(ABCDE)A.简单统计分析B.3sigma原则C.箱型图分析D.聚类分析E.1OF(局部异常因子)检测异常值8.识别缺

7、失值常用函数有(AC)A. is.na函数B. is.NA函数C. Comp1etexases函数D. Comp1etexase函数十、上机题1.导入贷款数据accepts.csv到R中,对数据集accepts按照变量badjnd进行等比例分析,分成75%:25%两份。#导入数据accepts-read.csv(,accepts.csv)#对accepts按照变量badjnd进行等比例分析,分成75%:25%两份Iibrary(caret)prop.tab1e(tab1e(accepts$bad_ind)index-CreateDataPartition(accepts$bad_indztim

8、es=1,p=0.75Jist=F)train-acceptsindexztest=w实现代码:Hbrary(ggpot2)qp1ot(mtcars5wt,mtcarsSmpg,main=利用qp1ot函数绘制散点图,1ab=Weight(10001bs),zy1ab=Mi1es(US)ga11on)2 .对上图进行优化,实现以下效果:利用qpot质数拴制敢点图302010g6ns5W实现代码:ibrary(ggp1ot2)p-ggp1ot(mtcarszaes(wtzmpg)+geom_point(shape=7zsize=2,co1our=green)+Iabsftit1e=利用qp1ot

9、函数绘制散点图,x=Weight(10001bs)zy=Mi1es(US)ga11on)+sca1e_x_continuous(1imits=c(0z10)+sca1eycontinuous(1imits=c(0z4)3 .修改上图的主题,实现如下效果:实现代码:mytheme-theme(p1ot.tit1e=e1ement_text(face=bo1d.ita1ic,SiZe=14,CoIOr=brown),ais.tit1e=e1ement-tt(face=bo1d.ita1ic,size=10zco1or=,brown),ais.text=e1ement-tt(fce=,bo1dzsi

10、ze=9zco1or=darkb1ue),pane1.background=e1ement-rect(fi11=,white,zco1or=,darkb1ue)/pane1.grid.major.y=e1ementjine(co1or=,grey,1inetype=1)zpane1.grid.minor.y=e1ementjine(co1or=grey,z1inetype=2)zpane1.grid.minor.x=e1ement-b1ank()p+mytheme一、多选题1 .常用聚类分析技术有(ABCDE)A. K-均值聚类(K-MeanS)B. K-中心点聚类(K-MedoidS)C.

11、密度聚类(DenSit-basedSpatia1C1usteringofApp1icationwithNoisezDBSCAN)D.层次聚类(系谱聚类Hierarchica1CIusteringzHC)E.期望最大化聚类(EXPeCtationMaximizationzEM)2 .常用划分(分类)方法的聚类算法有(AB)A. K-均值聚类(K-MeanS)B. K-中心点聚类(K-MedoidS)C. 密度聚类(DenSit-basedSpatia1C1usteringofApp1icationwithNoisezDBSCAN)D. 聚类高维空间算法(C11OUE)3 .层次聚类分析常用的函数有(ABC)A. hc1ust()B. cutree()C. rect.hc1ust()D. ctree()4 .K-均值聚类方法效率高,结果易于理解,但也有(ABCD)缺点A.需要事先指定簇个数kB.只能对

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 应用文档 > 工作总结

copyright@ 2008-2022 001doc.com网站版权所有   

经营许可证编号:宁ICP备2022001085号

本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有,必要时第一文库网拥有上传用户文档的转载和下载权。第一文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知第一文库网,我们立即给予删除!



客服