《数据挖掘概念与技术 教学大纲.docx》由会员分享,可在线阅读,更多相关《数据挖掘概念与技术 教学大纲.docx(5页珍藏版)》请在第一文库网上搜索。
1、数据挖掘概念与技术课程教学大纲学分:4理论学时:32实践学时:32一、课程性质与教学目标数据挖掘概念与技术是信息与计算科学专业本科生的一门专业应用必修课程,是该专业课程体系中重要应用课程之一。本课程主要介绍数据挖掘的基本概念、基本方法和基本技术。学生在学习过程中可以通过大量的案例和相关练习,逐步掌握数据挖掘的数据预处理、关联规则分析、分类分析和聚类分析的基本算法。本课程的先修课程为大学计算机基础、数据结构、高等数学。二、基本要求通过本课程的教学,了解数据挖掘的基本技术和基本思想。能比较熟练地应用现有数据挖掘软件处理实际领域的数据分析问题。初步掌握数据挖掘的步骤,为实际应用领域复杂数据分析打下良
2、好的理论和实践基础。三、主要教学方法讲授、演示、讨论、上机实践。四、理论教学内容第一讲数据挖掘引论【授课学时】4学时【基本要求】了解和掌握数据挖掘的发展历史、基本概念、应用领域和主要问题。【教学重难点】重点:数据挖掘的基本概念。难点:数据挖掘的模式。【授课内容】数据挖掘的发展历史;基本概念;应用领域;主要问题。第二讲认识数据【授课学时】4学时【基本要求】了解和掌握数据对象与属性类型、数据可视化、度量数据的相似性和相异性。【教学重难点】重点:数据对象与属性类型。难点:数据的相似性和相异性。【授课内容】数据对象与属性类型;数据可视化;度量数据的相似性和相异性。第三讲数据预处理【授课学时】6学时【基
3、本要求】掌握数据预处理的基本步骤,每一步的基本方法;熟悉数据清洗、数据集成、数据归约和数据变换的基本方法。初步了数据预处理的基本思想和方法。【教学重难点】重点:数据预处理的基本步骤,每一步的基本方法。难点:数据清洗和数据变换。【授课内容】数据预处理的基本步骤;数据清洗;数据集成;数据归约和数据变换。第四讲关联规则挖掘【授课学时】6学时【基本要求】掌握关联规则的基本概念和基本挖掘方法以及评价方法。【教学重难点】重点:关联规则的基本挖掘方法-APriOri算法。难点:APriori算法思想和关联规则评价。【授课内容】基本概念;APriOri算法;挖掘频繁项集的模式增长方法;模式评价。第五讲分类挖掘
4、【授课学时】6学时【基本要求】重点分类挖掘的基本概念,决策树分类,贝叶斯分类,模型评估与选择,提高分类的技术。【教学重难点】重点:决策树分类。难点:模型评估与选择。【授课内容】基本概念;决策树分类;贝叶斯分类;模型评估与选择;提高分类的技术。第六讲聚类挖掘【授课学时】6学时【基本要求】掌握聚类分析的基本概念和基本方法,熟练掌握k均值聚类、层次聚类和基于密度的聚类算法思想,熟练掌握聚类评估方法。【教学重难点】重点:k均值聚类、层次聚类和基于密度的聚类算法思想。难点:聚类评估方法。【授课内容】基本概念;k均值聚类;层次聚类;基于密度的聚类算法;聚类评估方法。五、实验教学内容项目一数据预处理【实验类
5、型】验证性【实验学时】8学时【实验目的】让学生通过使用数据挖掘软件和编程来验证和实践每类数据预处理方法,加深对每种数据预处理方法的理解和感受。【实验内容摘要】讲解应用数据挖掘软件和编程验证数据缺失值、噪声数据数据变换的基本流程,然后给一个类似的问题让学生上机实践。【实验基本要求】(1)掌握数据清洗的基本步骤和实现;(2)掌握数据变换的基本步骤和实现;【主要仪器设备名称及规格、型号】安装有数据挖掘软件的计算机。项目二关联规则分析【实验类型】设计性【实验学时】8学时【实验目的】通过实验加深学生对关联规则的理解,能利用关联规则来解决实际问题。【实验内容摘要】利用数据挖掘软件编程实现Apriori算法
6、和FP-tree算法,然后给一个相关的任务让学生分组讨论、编程实现。【实验基本要求】(1)掌握APriori算法的基本步骤和实现;(2)掌握FPtee算法的基本步骤和实现;【主要仪器设备名称及规格、型号】安装有数据挖掘软件的计算机。项目三分类挖掘实践【实验类型】设计性【实验学时】8学时【实验目的】通过实验加深学生对分类方法的理解,能利用分类方法来解决实际问题。【实验内容摘要】利用数据挖掘软件编程实现决策树算法和贝叶斯算法,然后给一个相关的任务让学生分组讨论、编程实现。【实验基本要求】(1)熟悉决策树算法的思想和实现;(2)熟悉贝叶斯算法的思想和实现;【主要仪器设备名称及规格、型号】安装有数据挖
7、掘软件的计算机。项目四聚类分析【实验类型】设计性【实验学时】8学时【实验目的】通过实验加深学生对聚类分析算法的理解,能利用聚类分析解决实际问题。【实验内容摘要】利用数据挖掘软件编程实现k-均值算法和层次聚类算法,然后给一个相关的任务让学生分组讨论、编程实现。【实验基本要求】(I)熟悉k均值算法的思想和实现;(2)熟悉层次聚类算法的思想和实现;【主要仪器设备名称及规格、型号】安装有数据挖掘软件的计算机。六、考核方式考核类型:考试考核形式:闭卷七、主要参考资料1数据挖掘概念与技术JiaWeiHan,机械工业出版社,2015年。2、MAT1AB数据分析与挖掘实战张良均,机械工业出版社,2015年。3、机器学习周志华,清华大学出版社,2016年。4、机器学习PeterF1ach,人民邮电出版社,2016年。