《商务智能试卷2套.docx》由会员分享,可在线阅读,更多相关《商务智能试卷2套.docx(8页珍藏版)》请在第一文库网上搜索。
1、桂林电子科技大学试卷2023-2023学年第2学期;课号2221525、2221766课程名称商务智能与数据挖掘(A、B卷开、闭卷);适用班级(或年级、专业)Q2Qjft息管理与信息系统、数字经济/(每位考生需要答题纸(8k)2张、草稿纸(16k)1张)题号一二三四五六七八九十成绩满分30202030得分评卷人考试时间120分钟班级学号姓名一、单选题(30分,2分*15题)1 .数据挖掘基本任务不包括()A.分类与预测C.关联分析2 .聚类分析要求()B.聚类分析D.最优化分析A.类别内数据“差异性”尽可能小,B.类别内数据“差异性”尽可能大,C.类别内数据“差异性”尽可能小,D.类别内数据“
2、差异性”尽可能大,类别间“差异性”尽可能小类别间“差异性”尽可能大类别间“差异性”尽可能大类别间“差异性”尽可能小3.数据标准化主要目的是()A.消除指标之间的量纲和大小不一的影响B.完全消除数据之间的差异C.节省数据计算时间D.减少数据计算存储空间4.数据规范化方法不包括()A.最大.最小规范化C.1og变化5.数据预处理不包括()B.零.均值规范化D.离散化B.关联规则的产生)B.贝叶斯分类A.数据清洗B.数据集成6 .关联分析主要任务是()A.支持度分析7 .分类算法不包括(A.决策树C.数据变换和规约D.数据可视化C.模式分析D.结构挖掘C.逻辑回归D.K-medoids8.下列关于分
3、类说法错误的是OB.分类通过学习得到一个目标函数A.分类是一种有监督的学习过程D.训练数据中的类别是未知的C.钻取D.旋转)C.数据转换D.数据关联B.基于层次的方法D.基于智能的方法这是关联分析的()B.置信度D.提升度B.决策树包括决策点、分支、叶节点D.决策树主要用于因果关系发现B.信息增益(InfoITnatiOnGain)方法D.文木相关性分析方法B.结构挖掘D.传播挖掘C.分类包括训练阶段和测试阶段9 .O1AP基本操作不包括()A.切片B.过滤10 .知识发现过程不包括下列哪个阶段(A.数据清理B.数据集成11 .聚类算法不包括()A.基于划分的方法C.基于密度的方法12 .项集
4、A出现以后,另一项集B出现的概率,A.支持度C.信任度13 .关于决策树分类器说法错误的是()A.决策树是一种分类算法C.决策树基于燧、信息增益等进行属性选择14 .文本特征提取常见方法不包括()A.互信息方法(MUtUaI1nfOrmation)C.TF-IDF方法15 .Web挖掘不包括()A.内容挖掘C.使用挖掘二、判断题(20分,2分*10题,正确标记J,错误标记X)1 .数据清洗主要是删除原始数据集中的无关、重复数据,平滑噪声数据,处理缺失值、异常值等。()2 .分类是构造一个分类模型,输入样本的属性值,输出对应的类别,将每个样本映射到预先定义好的类别。()3 .决策树是一种根据信息
5、端进行聚类和回归的算法。()4 .项集A发生,则项集B也同时发生的概率为关联规则的提升度。()5 .数据规范化的主要目的是方便存储、节约计算时间。()6 .数据集成是将多个数据源合并存放在一个一致的数据存储中。()7,分类算法通过学习得到一个目标函数。()8 .为了消除指标之间的量纲和大小不一的影响,需要进行数据离散化处理。()9 .聚类是一种有监督的学习过程。()10 .自然语言处理先后经历了规则阶段和统计方法阶段。(三、名词解释(20分,4分*5题)1 .O1AP2 .支持度3 .频繁项集4 .分类5 .情感分析四、简答题(30分,6分*5题)1 .数据挖掘流程模型:SEMMA和CRISP
6、-DMo2 .知识发现过程。3 .数据预处理基本方法。4 .最近邻分类器(K-NeareStNeighbOrS)主要思想、步骤及特点。5 .K-means聚类算法主要思想、步骤及特点。桂林电子科技大学试卷2023-2023学年第2学期;课号2221525、2221766课程名称商务智能与数据挖掘(A、B卷开、闭卷);适用班级(或年级、专业)Q2Qjft息管理与信息系统、数字经济/(每位考生需要答题纸(8k)2张、草稿纸(16k)1张)考试时间120分钟班级学号姓名题号一二三四五六七八九十成绩满分30202030得分评卷人五、单选题(30分,2分*15题)16 .商务智能系统的主要作用不包括()
7、A.提升运营水平B.获取竞争优势C.改善业绩D.战略分析17 .智能商务数据来源不包括()A.企业资源计划(ERP)B.供应链管理(SCM)C.客户关系管理(CRM)D.神经网络系统18 .知识发现过程不包括下列哪个阶段()A.数据清理B.数据集成C.数据转换D.数据量化分析19 .数据规约包括()A.维规约、数量规约和数据压缩B.变量规约和维规约C.数量规约和数据转换D.维规约与数据转换20 .常见的连续属性离散化方法不包括()A.等宽法B.基于聚类分析的方法C.等频法D.基于大数据分析方法21 .关于数据规范化说法错误的是()A.最大.最小规范化将数据映射到0,1区间B.规范化后数据之间的
8、关系改变了C.规范化按一定比例对数据进行缩放D.零均值规范化后数据服从标准正态分布22 .数据仓库特点不包括()A.面向主题B.集成C.相对稳定D.智能23 .关联分析中将事务集合中同时出现的频繁项组成子集,且满足最小支持度阈值,称为()A.项集B.频繁项集C.关联规则D.频繁度24 .分类算法不包括()A.决策树B.贝叶斯分类C.逻辑回归D.K-medoids25 .下列关于聚类说法错误的是()A.聚类是一种无监督的学习过程C.聚类根据数据对象的相似性进行划分26 .关于决策树分类器说法错误的是()A.决策树是一种分类算法B.聚类分析通常需要构建距离函数D.聚类分析要学习一个目标函数B.决策
9、树包括决策点、分支、叶节点27 .下面哪些不是聚类算法()A.K-meansC.DBSCAN28 .下列关于分类说法错误的是()A.分类是一种有监督的学习过程C.分类包括训练阶段和测试阶段29 .文本预处理内容不包括()A.文本清理、分词C.文本向量化30 .Web结构挖掘经典算法包括()APageRank算法C.KNN算法B.K-mediodsD.HITS算法B.分类是通过学习得到一个目标函数D.训练数据中记录的类别是未知的B.文本特征提取D.文本相关性计算B.K-means算法D.神经网络算法C.决策树基于嫡、信息增益等概念进行属性选择D.决策树用于因果关系发现六、判断题(20分,2分*1
10、0题,正确标记J,错误标记X)I1商务智能可以帮助企业提升运营水平、改善绩效、获取竞争优势。()12 .按管理层次划分,决策可以分为战略决策、战术决策和业务决策。()13 .数据仓库是一个面向主题、集成的、相对稳定的、反映历史变化的数据集合。()14 .项集A发生,则项集B也同时发生的概率,称为关联规则的提升度。()15 .数据规范化的主要目的是方便存储、节约计算时间。()16 .O1TP表示联机分析处理,O1AP表示联机事务处理。()17 .常见的分类算法有:逻辑回归、朴素贝叶斯、决策树等。()18 .基于划分的聚类包括:K-means和K-mediods。()19 .文本挖掘主要是抽取有效、新颖、有用、可理解的知识。()20 .聚类是一种有监督的学习过程。()七、名词解释(20分,4分*5题)1 .数据仓库2 .置信度3 .关联规则4 .聚类5 .TF-IDF八、简答题(30分,6分*5题)6 .商务智能的作用。7 .数据规范化主要方法。8 .数据挖掘的基本任务。9 .K-means聚类算法主要思想、步骤及特点。10 .朴素贝叶斯分类器主要原理及特点。