《数据分析与可视化-教学大纲.docx》由会员分享,可在线阅读,更多相关《数据分析与可视化-教学大纲.docx(11页珍藏版)》请在第一文库网上搜索。
1、数据分析与可视化教学大纲(202X-202X第X学期)课程名称:数据分析与可视化(DataAnaIySiSandVisua1ization)授课教师:XX老师,教授,博士生导师答疑时间:实验课、每周二下午3:00-5:00办公室:XXXXX邮件地址:XXXXXXXXXXXXX联系电话:XXXXXXXX课程类别:专业必修课/专业选修课课程班级:XXXXXX课程安排:202X年9月7S-202X年1月15日地点:科研实验大楼702室时间:周三18:00-19:45课程调整:根据学校相关节假日通知期终考试时间:202X年底或202X年初学分总学时理论教学学时实践教学学时其他23422102课件网址:
2、XXXXXXX教材和参考书目:指定教材:数据分析与可视化冯兴东、刘鑫,人民邮电出版社,2023.参考教材:GarrettGro1emunc1andHad1eyWickhamRforDataScience0,Rei11yMedia,Inc.出版,2017预备知识本课程为数据科学与商务统计方向学生必修课程,假设学生已经完全掌握微积分、矩阵运算以及初等概率论以及部分统计建模的知识的前提条件下讲授课程。课程达成目标:数据分析与可视化是一门重要的基础实践课,是研究和揭示随机现象统计规律性的统计科学,是研究如何有效地收集数据,如何对数据进行推理,以便对问题进行推断或预测,从而对决策和行动提供依据和建议的学
3、科。通过该课程的学习,学生首先应能掌握数理统计的基本概念、主要理论和方法,最主要是要培养具备统计学的基本思想和思维方式。通过训练,学生应能具有一定的创造性思维能力、推理分析能力和较强的动手能力,并能运用所学的统计方法分析研究现实生活中的一些随机现象,并解决实际问题。同时,为进一步学习后继专业课程和深造打好良好的基础。课程设置知识要求:本课程为统计学、数据科学及商科相关专业的学科共同课程之一,假设要求学生已经完全掌握微积分、矩阵运算以及初等概率论及部分统计建模知识的前提下学习此课程。本课程以Py1hOn框架为基础,系统地介绍数据分析与可视化的理念、工作流程、常见的可视化工具及其在统计建模方法上的
4、应用和展示,并针对特定类型的数据、特定的应用场景展示详尽的实际案例,辅以对应章节的教学课件、习题和代码,可以让读者由浅入深地进行数据分析和可视化。各章主要内容如下。第1章主要介绍数据、信息、知识之间的差异,如何收集、处理和组织数据,数据可视化的简单发展史,以及如何通过对数据的可视化展示来帮助决策。第2章介绍如何生动地对数据进行可视化展示,介绍一些最佳的可视化实践和基本的统计学术语、Python中的可视化工具,以及交互式可视化的理念等。第3章介绍PythonIDE工具,如何利用AnaConeIa进行可视化展示,以及常见的交互式可视化的程序包,如Bokeh、ViSPy等。第4章介绍常见的基于Pyt
5、hon的数值计算和交互式绘图的程序包,如NumPy.SciPy等;介绍如何定义标量和切片检索,常见的数据结构,如堆栈、元组、队列等,以及Hiatp1ot1ib可视化程序包等内容。第5章介绍常见的机器学习方法和预测模型,如回归方法、KNN算法、逻辑回归、支持向量机、主成分分析等,并针对这些常见的机器学习方法进行可视化展示和分析,使得这些常见的机器学习方法可以更加生动地进行展示等。第6章介绍常见的金融数据结构及其对应的统计模型,同时针对这些常见的模型,进行可视化的展示,并对统计学方法进行简单的介绍等。第7章主要介绍生物网络数据的可视化,包括对带有图结构的数据进行统计建模以及可视化展示,并针对该类数
6、据的检验给出生动的可视化解释等。第8章主要介绍如何实现统计模拟、其他基于Python的常用的统计学函数、信号处理等内容,并对比其他平台的可视化工具,如R语言等。课程设置能力要求:作为统计学专业的最重要的基础理论课程,本课程主要通过教师理论讲解、学生解题训练,辅以小组讨论的形式。通过教师理论讲解,使学生掌握数理统计的基本概念、主要理论和方法,最主要是要培养具备统计学的基本思想和思维方式。通过训练,学生应能具有一定的创造性思维能力、推理分析能力和较强的动手能力,并能运用所学的统计方法分析研究现实生活中的一些随机现象,解决一些实际问题。考核形式期末考试采用开卷上机/期末论文方式,学生的最后的总分计算
7、方法如下:平时成绩(考勤+作业)40%(考勤10%,作业30%)期末考试260%试卷结构期末将以上机考试形式为主,内容包含程序和分析题。或者期末论文形式,具体要求详见相关说明。学术诚实涉及学生的学术不诚实问题主要包括考试作弊;抄袭;伪造或不当使用在校学习成绩;未经老师允许获取、利用考试材料。对于学术不诚实的最低惩罚是考试给予O分。其它的惩罚包括报告学校相关部门并按照有关规定进行处理。数据可视化教学要点教学大纲(书页编号以教材为准)第1章数据可视化概述错误!未定义书签。11数据、信息和知识理解错误!未定义书签。1.1.1 数据和信息错误!未定义书签.1.1.2 知识理解错误!未定义书签.1.2知
8、识的提取流程错误!未定义书签。1.2.1 从数据中提取信息错误!未定义书签.1.2.2 从信息中提取知识和理解建设!未定义书签。13数据可视化与统计图表错误!未定义书签。1.4 如何利用可视化帮助决策错误!未定义书签。1.5 总结错误!未定义书签。本章习题错误!未定义书签。第2章数据可视化错误!未定义书签。2.1 利用数据创造有趣的故事错误!未定义书签。2.2 可视化的一些最佳实践错误!未定义书签。2.3 Python中的可视化工具错误!未定义书签。2.4 交互式可视化和布局错误!未定义书签。2.5 总结错误!未定义书签。本章习题错误!未定义书签。3.1 PythonIDE错误!未定义书签。3
9、.1.1 Python3.x与Python2.7错误!未定义书签。3.1.2 不同类型的交互式工具错误!未定义书签.3.1.3 不同类型的PythonIDE错误!未定义书签。3.2 利用Anaconda进行可视化错误!未定义书签。3.2.1 绘制3D曲面图错误!未定义书签。3.2.2 绘制方形树状图错误!未定义书签。3.3 交互式可视化的库错误!未定义书签。33.1 Bokeh错误!未定义书签.33.2 VisPy错误!未定义书签。3.4总结错误!未定义书签。本章习题错误!未定义书签。第4章数值计算与交互式绘图错误!未定义书签。4.1 NUmPy、SCiPy和MK1函数错误!未定义书签。4.1
10、.1 NumPy介绍错误!未定义书签。4.1.2 SCipy介绍错谩!未定义书签。4.1.3 MK1函数介绍错误!未定义书签.4.2 标量选择、切片与索引错误!未定义书签。4.2.1 标量选择错误!未定义书签.4.2.2 切片错误!未定义书签4.2.3 数组索引错误!未定义书签。43数据结构错误!未定义书签。4.2.4 栈错误!未定义书签。43.3 集合修误!未定义书签。43.4 队列错误!未定义书签。43.5 字典错谡!未定义书签.43.6 矩阵表示的字典错误!未定义书签。43.7 字典树错误!未定义书签4.4 使用matp1ot1ib进行可视化错误!未定义书签。4.5 总结错误!未定义书签
11、。本章习题错误!未定义书签。第5章统计学与机器学习错误!未定义书签。5.1 分类方法错误!未定义书签。5.1.1 理解线性回归错误!未定义书签.5.1.2 线性回归错误!未定义书签.5.1.3 决策树错误!未定义书签.5.1.4 贝叶斯定理错误!未定义书签.5.1.5 朴素贝叶斯分类器错误!未定义书签.5.2 KNN算法错误!未定义书签。5.3 逻辑回归错误!未定义书签。5.4 支持向量机错误!未定义书签。5.5 主成分分析错误!未定义书签。5.6 k-means聚类错误!未定义书签。5.7 总结错误!未定义书签。本章习题错误!未定义书签。第6章金融和统计模型错误!未定义书签。6.1 回报率模
12、型和确定性模型错误!未定义书签。6.2 随机模型错误!未定义书签。6.2.1 蒙特卡罗模拟错误!未定义书签。6.2.2 投资组合估值错误!未定义书签.6.2.3 模拟模型错误!未定义书签6.2.4 几何布朗运动模拟错误!未定义书签.6.2.5 基于扩散的模拟错误!未定义书签。6.3 阈值模型错误!未定义书签。6.4 总结错误!未定义书签。本章习题错误!未定义书签。第7章图结构数据和网络模型错误!未定义书签。7.1 有向图和多重图错误!未定义书签。1 .1.1存储图数据错误!未定义书签.7 .12图形展示错误!未定义书签.7.2 图的聚集系数错误!未定义书签。73社交网络分析错误!未定义书签。7
13、.4 可平面图的检验错误!未定义书签。7.5 有向无环图的检验错误!未定义书签。7.6 最大流错误!未定义书签。7.7 随机块模型错误!未定义书签。7.8 总结错误!未定义书签。本章习题错误!未定义书签。8.1.1 利用TextBIob构造朴素贝叶斯分类器错误!未定义书签8.1.2 利用词云了解电影影评错误!未定义书签。8.2空间数据可视化错误!未定义书签。83计算机模拟错误!未定义书签。83.1 Python随机相关的程序包错误!未定义书签。83.2 SciPy中的随机函数错误!未定义书签。83.3 模拟示例错误!未定义书签.83.4 信号处理错误!未定义书签.835动画错误!未定义书签.8.4 绘制交互图错误!未定义书签。8.5 总结错误!未定义书签。本章习题错误!未定义书签。