《数据挖掘实验大纲.docx》由会员分享,可在线阅读,更多相关《数据挖掘实验大纲.docx(2页珍藏版)》请在第一文库网上搜索。
1、数据挖掘实验大纲一、课程基本信息课程名称仲文)数据挖掘课程名称(英文)DataMining课程类型专业选修课学分3课程/实验总学时51/16适用对象应用统计学专业四年级考核方式闭卷考试,平时分20%,实验成绩10%,期末考试70%先修课程数学分析、高等代数、概率论、数理统计,应用多元统计分析二、课程简介数据挖掘是概率论与数理统计、多元统计分析的后继课程,是应用统计学专业的专业任选课程,对象为大学四年级学生。数据挖掘是从数据集中识别出有效的、新颖的、潜在有用的,以及最终可理解的模式的非平凡过程。知识发现将信息变为知识,从数据矿山中找到蕴藏的知识金块,将为知识创新和知识经济的发展作出贡献。本课程全
2、面而又系统地介绍了数据挖掘的方法和技术,结合数据挖掘工具讲解关联分析、聚类分析、判别分析、决策树、集成学习、随机森林、支持向量机和神经网络等挖掘数据的方法,教学学生如何使用数据挖掘工具挖掘数据发现知识的过程,同时向学生展示当前利用数据挖掘工具知识发现方面研究的最新成果。三、课程目标通过对数据挖掘课程的学习,使学生初步掌握数据挖掘工具的基本使用方法和数据挖掘的基本理论和方法,熟悉常用数据挖掘方法的应用方法。通过本课程的学习,要求学生初步学会常用数据挖掘软件的使用方法,初步掌握数据挖掘的重要概念和任务、数据挖掘中的常用算法(近邻分析、决策树、人工神经网络、支持向量机、聚类分析、关联分析和异常数据诊
3、断),以及数据挖掘当前的研究动向。四、实验内容实周实验内容拟实验实验所所需备验次时间形式需实验注序教仪器师数13R语言的数据基本操作2学时验证性18027近邻分析实验2学时验证性18039决策树实验2学时验证性180411人工神经网络实验2学时验证性80513支持向量机实验2学时验证性180615聚类分析实验2学时验证性180717关联分析实验2学时验证性180818综合性实验2学时考试180五、实验教材和参考书实验教材:(1)薛薇,R语言数据挖掘,中国人民大学出版社,北京,2016年4月第一版实验参考书:黄文,王正林,数据挖掘:R语言实战,电子工业出版社,北京,2014年C(2)张良均,云伟
4、标,王路,R语言数据分析与挖掘实战,机械工业出版社,北京,2015年。(3)薛毅,陈立萍,统计建模与R软件,清华大学出版社,北京,2007年4月。(4)张良均,王路,谭立云,苏剑林,Python数据分析与挖掘实战,机械工业出版社,北京,2017年4月。六、教学策略与方法的建议在本课程讲解过程中,重视向学生展示数据挖掘工具的使用方法和常用的数据挖掘方法的应用。授课过程中将数据挖掘基本方法和解决实际问题紧密结合,比如向学生展示数据挖掘在电力窃漏电用户自动识别、航空公司客户价值分析、家用电器用户行为分析与事件识别、电子商务网站用户行为分析及服务推荐等实际生活领域中的应用。讲授过程中尽可能避免讲授抽象的数学和统计学知识和理论。教学过程中重视数据挖掘软件的学习和使用,引导学生利用R语言等软件做数据挖掘实验,有条件开展课程设计,提交课程设计报告。