《工业大数据分析散点图教学讲义.docx》由会员分享,可在线阅读,更多相关《工业大数据分析散点图教学讲义.docx(7页珍藏版)》请在第一文库网上搜索。
1、任务5.1散点图任务概述散点图是一种数据点在坐标系平面上的分布图,通常用来显示和比较数值,反映两个变量之间的数据值关系和变化趋势。本案例通过搭建散点图应用案例,介绍用散点图实现基于工业数据的统计图表展示方法。图5-1-1散点图图标数据格式:令数值型字段参数说明:散点图字段名叮(数值)移ass一显示国点v点击查看功能说明确定取消注:此处的属性做名词来解释,是指水平轴此列表的数据均为同一属性散点图参数:表5-1散点图参数说明参数类型描述X轴列表框用户选择水平轴的属性列Y轴列表框用户选择垂直轴的属性列颜色设置下拉框系统默认的几种样式和配色显不下拉框提供圆点、方形、三角形等描绘数据点案例数据集:本案例
2、的数据是经脱敏后的锅炉传感器采集的数据(采集频率是分钟级别),根据锅炉的工况,预测产生的蒸汽量。数据分成训练数据和测试数据,其中包含2888行数据,字段“VO”-“V37”为38个不同位置传感器采集的数据,将这38个字段作为特征变量,target”作为目标变量。该案例关注均方根误差。训练数据包括2个文件,文件Industria1Steam1.x1sx有1860行数据,文件IndUStriaISteam2.x1SX有1028行数据,共2888行数据。2个表结构如下图:表结构(共2888行,39列)如下表:表5-2表结构I:数据类型数据样例解释说明V0-V37数值型(DOUB1E)0.566脱敏后
3、的过滤传感器采集数据(采集频率以分钟进行)target数值型(DOUB1E)0.156蒸汽量表预览如下图:WVtvv1V4VSWVTWVMVWVMVMVMmtoreC*atA14ia4o?AWAtOI-IJU-2Jt一CttV374mMOIIUMCIHamQ3QSMatO0J1,M-Ut33Q1”OJMamAHWMaw037auAZV13U6a*JMMSdWanQMeaiMawAATt1,MtAMXS-AOMJMJM41UJ0OOMaMamCMT-OtM183-ZMJN4MSaji5M4UAMM0443O4M-1MIMMJM-AJVOJM-amAMS308ft4MamOJM.1皿21M-oj*
4、,OSAJMM1AM*11.W14Mart4U3”-1*OUAJMAMI1.WMMMH1.1Uawamam(4MamM10J9JMOaM4M,041VCF-IM-UMJ1WAW1-QJW-IM1-IMA441-a-GM1-amtJM-tm07MQMatM3Q-1.W-aw-IOt1-1MB-141AM31,M7an&M4aMIX-IAM-Mi10J1*1MOeOJAm图5-6表预览通过本任务的学习:(1)能够使用散点图可视化展示工业大数据。任务实现实操操作如下:步骤1用户登录算法建模工具产品,打开数据分析,打开或新建挖掘分析模型后,在产品界面左侧菜单“数据管理一输入”菜单下,如图5-1-3所示
5、:W工亚大敢麻处理A祈应用实训皇CC1TIndustria1BigDataProcessAna1ysisandApp1ication1abg1a用户皆理我的挖掘III1图5-1-5文件上传界面步骤4:在“图5T-5”中点击“文件上传”按钮,选择待上传的文件“Industria1Steam1x1sx”点击打开,如图5-1-6所示,点击“确定”,如图5-1-7所示。图5-1-7中可查看具体数据内容及数据结构,点击“确定”关闭界面。腼工作表名称Sheet1起始行2起始列1Q提取表头覆盖同名文件定图5-1-6文件上传界面文件输入口X诩躁据文件上传删除全删踪数据内苕数据结构XNIndustrid1Ste
6、dm1V1V205660.0160.1430968043700661130.5680.2350.7330.36802830E840.638026CAASnA*)7分区记录条数100000点建号功能说明造定图5-1-7选择数据界面步骤5:建模区拖入“图表分析-基本-散点图”节点,构建如下模型,如图Ind1JStriaISteamI散点图AI:Q-Q图5-1-8散点图建模步骤6:双击“散点图”节点,进行配置如下,点击确定,如图5-1-9所示:散点图X数值宁段名X铀(数伯)移除eVivVOV2V3宁段宫Ytt移除V41OtargettargetVS;IIV6IV7生警数配瓮颜色设置鸵H;显示BI点7点击查看功能说明提定取消图5-1-8散点图-文件输入-数值步骤7:点击运行按钮,如图5-1-9所示图5-1-9运行界面图步骤8:模型运行结果参考下图,如图5-1-10所示:图5-1-10散点图-模型运行结果运行结果分析:散点图是一种数据点在坐标系平面上的分布图,通常用来显示和比较数值,反映两个变量之间的数据值关系和变化趋势。