《工业大数据分析-回归评估.docx》由会员分享,可在线阅读,更多相关《工业大数据分析-回归评估.docx(5页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、任务8.1回归评估任务概述回归评估是对自变量相同和因变量相同的数据集,比较一种回归算法一组参 数、不同参数组合或者多种回归算法之间的分析性能,检验回归模型的可靠性; 最终根据一些评价的指标(如相对误差等等指标)或者图表展示,获得质量最佳 的回归模型。本任务使用回归评估节点的使用为例讲述案例实操过程。回归评估O WAL 0IA Q图8-1-1回归评估图标数据格式:(1)回归模型:机器通过学习与训练已有的数据构建回归模型,从而预测 新数据的类别。(2)回归数据集:数据集,又称为资料集、数据集合或资料集合,是一种 由数据所组成的集合。回归数据集即用于回归的数据集。数据说明:本段中所用数据为风机结冰故
2、障数据。(1)数据集文件名称:fengji_data_tl_demo3. csvo(2)数据集案例背景:叶片结冰是风电领域的一个全球范围难题。低温环境所导致的叶片结冰、材 料及结构性能改变、载荷改变的问题等,对风机的发电性能和安全运行造成较大 的威胁。随着风机的设计功率不断提升,现有风机塔筒高度也在不断增长,因此 即使在北部沿海和山区地区,冬季里大量风机都会触碰到较低的云层,在低温和 潮湿环境下非常容易结冰。目前风机运行的实时数据主要由SCADA系统进行存 储,对叶片结冰故障的监测手段主要是比较风机实际功率与理论功率之间的偏差, 当偏差达到一定值后会触发风机的报警和停机。然而,触发报警时往往已
3、经发生 叶片大面积结冰现象,在这样的情况下运行会增加叶片折断损坏的风险。虽然许 多新型风机都设计了自动除冰系统,但是实际应用中面临的挑战是很难对结冰的早期过程进行精确预测,以便能够尽早开启除冰系统。对结冰过程的预测准确度 决定了除冰系统的效率、风机的效率损失和风机运行的风险。(3)数据集字段说明表8-2数据集字段说明字段名称数据类型数据样例解释说明time字符型2015/11/4 0:00数据采集时间windspeed数值型(DOUBLE)1.096584281风速generator_speed数值型(DOUBLE)1.236889745发电机转速power数值型(DOUBLE)1.00893
4、9网侧有功功率(kw)winddirection数值型(DOUBLE)1.537073对风角(。)yaw_position数值型(DOUBLE)-0.62627偏航位置yawspeed数值型(DOUBLE)-0.03896偏航速度pitchl_angle数值型(DOUBLE )0.222222叶片1角度pitchl mototmp数值型(DOUBLE)-1. 389叶片1变桨电机温度acc_x数值型(DOUBLE )-1.02399X方向加速度acc_y数值型(DOUBLE)0.061109y方向加速度environment tmp数值型(DOUBLE)-0. 8947环境温度int_tmp数
5、值型(DOUBLE)-0.92206机舱温度pitchl_ng5_DC数值型(DOUBLE)-0.8叶片1 ng5充电器直流电 流pitch2 ng5 DC数值型(DOUBLE)0. 48叶片2 ng5充电器直流电 流pitch3_ng5_DC数值型(DOUBLE)一0. 08叶片3 ng5充电器直流电 流frozen_state布尔型(BOOLEN)0结冰状态通过本任务的学习:(1)会使用回归评估模型检验线性回归模型应用于工业大数据分析的可靠性。任务实现模型构建流程如下:步骤1:建模区“数据管理”下拉列表内拖入“文件输入”节点、“数据处 理”下拉列表内拖入“设置角色节点”、“机器学习”下拉列
6、表内拖入“线性回 归“模型管理,下拉列表内拖入“回归评估,节点,每个节点互相点击连接,构建如下模型,如图8T-2所示:fengjidatatl.隹色归回归评估图8-1-2回归评估构建模型步骤2:点击“文件输入”节点,弹出下图,点击“选择数据”右下方图标, 上传数据文件,配置如下,如图8-1-3所示:fengji_data_t1_demo3醒傩文件上传删除全部删除X数据内容数据结构csv fengji_data_t1 _demo3timewindspeedgenerator speed2015/11/4 0:001.0965842811.2368897452015/11/4 0:010.9453
7、776631.2634801842015/11/4 14:040.6761561241.2501849652015/11/414)51.0744564841.2734515992015/11/4 14)61.1113361471.2800992092015/11/4 14)71.7382904171.263480184分区记录条数100000点击查看功能说明确定取消步骤3: “设置角色”节点配置如下,如图8-1-4所示:设置角色x全部o字符o数值 o日期 o文本 o向量序号字段名名称类型角色设定移除q|e8pitchlanglepitchi angle数1(DOUBLE目Xe9pitchi _
8、moto_tpitchi _moto_t数整(DOUBLE目交量Xe10accxaccx数鲤(DOUBLE目Xe11acc_yacc_y数尊DOUBLE自Xo12environmenttenvironmentt效胭(DOUBLE目强Xe13inttmpinttmp致值型(DOUBLE目一Xe14pitchi _ng5_DCpitchi _ng5_DC数值型(DOUBLE目,X15pitch2_ng5_DCpitch2_ng5_DC数型(DOUBLE目变量Xe16pitch3_ng5_DCpitch3 ng5_DC效鲤(DOUBLE目SBXe17froze nstatefroze nstate数
9、值型(INT)三支量X点击查看功能说明确定取消图8-1-4回归评估-设置角色-节点配置步骤4: “机器学习”下拉列表内拖入“线性回归”节点,配置如下,如图8T-5所不:线性回归维标准化数据后准化无处理基本选项是否 昆不要性最大迭代次数100求解方法Auto7点三直看功能说明确定取消步骤5:点击上图“确定”按钮,完成配置,点击右上角运行按钮,运行后 在“洞察,中查看模型运行结果,如下图8-1-6、图8T-7所示:B刖评M X建经83s案35tc.e任性回归赳回日深晨0*5?SS0.17380XM76平虎的俣差二为也篇受羞0.3130SE住回归均方*金0XM76侬:晨役0.6356最大用过褒差0.
10、63%翎蛎归均方喂加02181母“电再也基0.00010.0030图8-1-6回归评估-模型运行结果1宾 回归的X取工8r客隼全0至8融回归SEaiPB澳差汨a次差asc.0一观则S277信身赛京境计IBAJC| -1XW3160.6326RtN?276BIC2.5578谓警灯 R 方-InfinityMSE0.0476HQJ -13251D-Wttifi0.4296方差分析9自三度平方知均方F值PrF275。22.67890.08250.006304466国差1Q13.172313.1723校正dit276Q35.8511图8-1-7回归评估-模型运行结果2运行结果说明:通过以上运行结果学习自变量相同和因变量相同的数据集, 比较一种回归算法一组参数、不同参数组合或者多种回归算法之间的分析性能, 检验回归模型的可靠性;最终根据一些评价的指标(如相对误差等等指标)或者 图表展示,获得质量最佳的回归模型。