《工业大数据分析特征分析教学讲义.docx》由会员分享,可在线阅读,更多相关《工业大数据分析特征分析教学讲义.docx(8页珍藏版)》请在第一文库网上搜索。
1、任务4.3特征分析任务概述特征分析是指对样本数据进行相应分析,提取能描述数据的一些特征点,这些特征点尽可能简单全面地表达数据所蕴含的数值范围、分布等信息。本任务主要描述使用特征分析进行数据分析的过程。本任务中的案例使用的数据集来源自某台风力电机IOn1in间隔SCADA真实运行数据,主要有4个维度信息,分别为时间戳(Time)、风速(WindSpeed).功率(POwer)和风轮转速(RotOrSPeed)O数据文件:fengji_data_t1_demo5.csv0数据集格式及属性字段说明:字段名称数据样例数据类型字段描述time2015/11/40:00字符型数据采集时间windspeed
2、1.096584281数值型(DOUB1E)风速generator_speed1.236889745数值型(DOUB1E)发电机转速power1.008939数值型(DOUB1E)网侧有功功率(kw)winddirection1.537073数值型(DOUB1E)对风角()yaw_position-0.62627数值型(DOUB1E)偏航位置yaw_speed-0.03896数值型(DOUB1E)偏航速度pitch1_ang1e0.222222数值型(DOUB1E)叶片1角度Pitch1mototmp-1.389数值型(DOUB1E)叶片1变桨电机温度acc_x-1.02399数值型(DOUB
3、1E)X方向加速度acc_y0.061109数值型(DOUB1E)y方向加速度environment_tmp-0.8947数值型(DOUB1E)环境温度int_tmp-0.92206数值型(DOUB1E)机舱温度pitch1_ng5_DC-0.8数值型(DOUB1E)叶片1ng5充电器直流电流pitch2ng5DC0.48数值型(DOUB1E)叶片2ng5充电器直流电流pitch3ng5DC-0.08数值型(DOUB1E)叶片3ng5充电器直流电流frozen_state0布尔型(BOO1EN)结冰状态数据预览:通过本任务的学习:(1)能够对工业大数据中的变量进行特征分析。任务实现数据特征分析
4、采用统计分析下的描述数据特征节点,用于总结观测数据,比如数据的个数,均值,最大最小值,标准差,缺省值个数等。描述数据特征IQ图4-3-1特征分析节点方差分析操作步骤如下:步骤1:用户登录算法建模工具产品,打开“数据分析”,打开“挖掘分析”模型,如图4-3-2所示。百工亚大款提处理分析应用实训皇CC1TIndustria1BigDataProcessAna1ysisandApp1ication1abI1I算法建模园可视化分析挖掘分析寿耀馍工具膏去首页SJgTM模型列表用户管理翊)论尼5我的挖底11138我的论症I111图4-3-2挖掘分析模型步骤2:新建挖掘分析模型,在界面左侧菜单“数据管理一输
5、入”菜单下,将“文件输入”节点拖至右侧建模区,如图4-3-3所示。图4-3-3文件输入文件输入选择敢据文件上传全部Ift燥数据内容被揖结构分区记WIOOOOO点击查看功能说明取酒图4-2-4文件输入界面单击“文件上传”按钮,选择待上传的文件“fengji_data_t1demO5.csv”,单击“打开”按钮,如图4-3-5所示。置。图4-3-5文件上传系统将弹出读取配置窗口,如图4-3-6所示,单击“确定”完成文件读取配图4-3-6文件上传-读取配置可在文件输入节点中查看读取的数据内容及数据结构,如图4-3-7所示。单击“确定”按钮,完成文件输入节点配置。文件输入送择数据文件上传跑除Q数据内容
6、数猖绡构csvfengji_data_t1_demo5timeWindjPeedgeneratOrJPeed2015/11/41860.4143105161.2568325752015/11/41870.7904830791.2501849652015/11/41880.2999835611.2568325752015/11/41890.4880698421.2734515992015/11/418:100.7462274831.2568325752015/11/418:110.3294872921.256832575分区记I(XXXX)装取消图4-3-7数据内容和数据结构步骤3:在界面左侧菜
7、单“统计分析”菜单下,将“描述数据特征”节点拖至右侧建模区,如图4-3-8所示。fengji_data_t1_.S0描述数据特征小图4-3-8描述数据特征节点步骤4:构建模型,关系构建如图4-3-9所示,描述数据特征节点的D端口为数据集,G端口为结果数据集。图4-3-9描述数据特征构建模型步骤5:在右侧建模区双击“描述数据特征”图标,进入描述数据特征配置界面,将左侧的wind_speed、Wind.direction、yaw_speed”、“frozen_state”属性选择到右侧表格中,如图4-3-10所示。字段名类型移除Owindspeed效值型(DOUB1E)XOWind.directi
8、onSfiffi(DOUB1E)XOyawespeedJSf1aSi(DOUB1E)Qfrozen.StateStSS(INT)描述数据特征全部O字符O芸值日期1timegenerator-speedpoweryawjxsitionPitCh1angIepitch1mototmp参数设置SSSS1BaN个SJQ缺失个JXQ最大值国最小值四极差双Q标港差Q平均值Q52数嚏度焉度李灯/日明髻Q完整个数Q缺失个数Q矮名计数Q录少计数Q分类计数S分类占比点圭查看切i汽*港定取消图4-3-10描述数据特征-节点配置单击“确认”,完成配置。步骤6:单击建模区右上角“运行”按钮,如图4-3-11所示。图4-3T1运行模型运行完成后,页面将自动跳转到洞察区,单击”描述数据特征”节点,可以查看其运行结果的数据图表和数据集,如图4-3-12所示。U/jEwbmtM*rOttAMMgf2BMMVMM1.M18O1切9om1&64MuOMm力ammO6*1ama4AM)WMdQK16801.MS7-112$IAtA1(Q15V51DaoQgQWOJQ04QnXIAMV.edXOOQMM01416a”44(QOMOtOIMt1041aoMtOOM13A144D3tnnnyu8O00。3仲00O55TMBanaibtae丽MM-H1MitBtf妙.at图4-3-12运行结果-图表