工业大数据分析回归算法教学讲义.docx

上传人:lao****ou 文档编号:555019 上传时间:2024-01-25 格式:DOCX 页数:17 大小:226.15KB
下载 相关 举报
工业大数据分析回归算法教学讲义.docx_第1页
第1页 / 共17页
工业大数据分析回归算法教学讲义.docx_第2页
第2页 / 共17页
工业大数据分析回归算法教学讲义.docx_第3页
第3页 / 共17页
工业大数据分析回归算法教学讲义.docx_第4页
第4页 / 共17页
工业大数据分析回归算法教学讲义.docx_第5页
第5页 / 共17页
亲,该文档总共17页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《工业大数据分析回归算法教学讲义.docx》由会员分享,可在线阅读,更多相关《工业大数据分析回归算法教学讲义.docx(17页珍藏版)》请在第一文库网上搜索。

1、任务6.1回归算法任务概述数值预测是对连续值函数进行预测的一类数据挖掘任务,通过构造相关的预测模型对连续数值进行预测。与分类问题相同之处在于数值预测也是有标号的学习问题,即监督学习问题,与之不同在于数值预测对连续的变量进行学习和预测,而分类对于离散的目标进行学习和分类。回归分析是最常用的统计学数值预测方法,它是在分析现象自变量和因变量之间相关关系的基础上,建立变量之间的回归方程,并将回归方程作为预测模型,根据自变量在预测期的数量变化来预测因变量的值。回归分析主要解决以下几个方面的问题:确定几个特定的变量之间是否存在相关关系,如果存在的话,找出它们之间合适的数学表达式。根据一个或几个变量的值,预

2、测或控制另一个变量的取值,并且可以知道这种预测或控制能达到何种精确度。进行因素分析。例如在对于共同影响一个变量的许多变量(因素)之间,找出哪些是重要因素,哪些是次要因素,这些因素之间又有什么关系等等。回归分析有很广泛的应用,例如实验数据的一般处理,经验公式的求得,因素分析,产品质量的控制,气象及地震预报,自动控制中数学模型的制定等等。多元回归分析是研究多个变量之间关系的回归分析方法,按因变量和自变量的数量对应关系可划分为一个因变量对多个自变量的回归分析(简称为“一对多”回归分析)及多个因变量对多个自变量的回归分析(简称为“多对多”回归分析),按回归模型类型可划分为线性回归分析和非线性回归分析。

3、以下内容分别以线性回归和决策树回归为例进行回归算法方面案例的讲解。通过本任务的学习:(1)能够构建线性回归模型对工业大数据进行分析。(2)能够构建决策树回归模型对工业大数据进行分析。任务实现611线性回归建模线性回归算法假设每个影响因素与目标之间是线性关系,并通过特征选择,得到关键影响因素的线性回归系统。该算法是利用数理统计中回归分析,来确定两种或两种以上变量间相互依赖的定量关系的一种统计方法,通过凸优化的方法进行求解。在实际业务中应用十分广泛。图6-1-1线性回归图标数据格式:必须设置类属性(输出),且类属性(输出)必须是连续型(数值);非类属性(输入)可以是连续型(数值)也可以是离散型(名

4、词)。参数说明:线性回归题眼住化无压基本法欣tJ7.12623411.1S660ZOI2O13jfi22加&91加刖(17SSdOUXOI2013a2200&91293290785S7O2065刈皿22786JXM.150.7855011234201322301.57OJ*548113Z2013823h00&8S2Z330176567186432O1W23M68627933OTS5521S32011234)0&3B2Z33017S5370107162O1M23SO6M2793307656570W2012362Z.130765O3tU1M201皿匕782233OM61UM1WnicOO32”.A

5、d837”幺NQVM3178M116641M55W2O1VMJ1MM162d92SW6W皿M60具体操作如下:步骤1:建模区分别拖入“文件输入”节点、“设置角色”节点和线性回归”节点,构建如下模型,如图6-1-3所示:文件痂入没置隹色S|A=;注性回归昌步骤2:“文件输入”节点配置如下,如图6-1-4所示:文件输入文件上传测除全部删除X数据内容数据结构分区记录条款I(XXXX)点上查看功能说明满足取图6-1-4线性回归-文件输入步骤3:点击“文件上传”按钮,选择待上传的文件“工业用水处理投药量数据.csv”点击打开,如图6-1-5所示:图6-1-5文件上传数据集选择图6-1-6文件上传-读取步

6、骤5:点击读取窗口中的确定按钮,文件读取配置成功,可在文件输入节点中查看读取的数据内容及数据结构,如图6-1-7所示:文件输入口X点短看功能说明诵定入文件上传删除XIQJ数据内容GV工IE用水如野陋量数据时间原水PH原水速度2013/8/206:007.13623462013/8/207:007.12628.812013/8/225:006.91294812013/8/226:006.91293292013/8/2319:006.818495M2伏出O分区记录金数100000点击查看功能耐图6T-8文件输入-文件上传-数据内容步骤7:点击“数据结构”,如图6-1-9所示,可以查看数据表的结构信

7、息,并支持对字段名和字段类型的编辑功能。点击确定按钮,完成文件输入节点配置。文件输入1S2S文件上传删除翎跚除OQ数据内自数楣结构CV:Dk用水处理投药量数据名称字段名类型BTiD原水PH原水PH数触(DOUB1E)原於麒原於s数值型(DoUB1E)出於度出水浊度数旌(DoUB1E)取?KS取水量数值型(INT)PAe3原水浊度感水没度Mfi(DOUB1E自变XI94出水浊度出水发度BaBKDOUB1E自变XO5取水取水Btas(INT)QXIXO6PAC我PACftB1f11型(DOUB1E因变X点击皆看动侬网确定取消图6-1-10线性回归-设置角色步骤9:“线性回归”节点配置如下,点击确认

8、,如图所示:线性回归XSHg标造化805标准化无处理V取瑚I点击查看功型沆明确定取消步骤10:点击右上角运行按钮,模型运行结果参考下图,如图6-1-12所示:线性回归的方程及其系数:图6-1-13线性回归方程及其系数O64M1H43W9外M图6-1-12线性回归-模型运行结果运行结果说明:最后一列属性prediction”为回归预测列。通过以上图片引导,了解了线性回归的数据格式和参数说明,进行了线性回归案例的实操,学习了如何配置模型,呈现了线性回归的方程及其系数。6.1.2决策树建模决策树回归(DeCiSionTree)算法是通过构建决策树来进行回归预测,在创建回归树时,使用最小剩余方差来决定回归树的最优划分,该划分准则是期望划分之后的子树误差方差最小。创建模型树,每个叶子节点都是一个机器学习模型,如线性回归模型。图6-1-14决策树回归图标数据格式:必须设置类属性(输出),且类属性(输出)必须是离散型(名词);非类属性(输入)可以是连续型(数值)也可以是离散型(名词);参数说明:决策树回归1条件毒戮信且皮员方式variance最大份IK32是否会示交量里要性取消图6TT5决策树回归-参数说表6-3决策树回归参数说明参数类型描述信息度量方式下拉框选择信息度量方法,文本型,取值范围:“variance”,默认值为variance”最大深度文本框树的最大深度,整

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 应用文档 > 工作总结

copyright@ 2008-2022 001doc.com网站版权所有   

经营许可证编号:宁ICP备2022001085号

本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有,必要时第一文库网拥有上传用户文档的转载和下载权。第一文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知第一文库网,我们立即给予删除!



客服