2022年人工智能天气决策树源代码 .pdf

上传人:C****o 文档编号:32975650 上传时间:2022-08-09 格式:PDF 页数:17 大小:540.41KB
返回 下载 相关 举报
2022年人工智能天气决策树源代码 .pdf_第1页
第1页 / 共17页
2022年人工智能天气决策树源代码 .pdf_第2页
第2页 / 共17页
点击查看更多>>
资源描述

《2022年人工智能天气决策树源代码 .pdf》由会员分享,可在线阅读,更多相关《2022年人工智能天气决策树源代码 .pdf(17页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、实用文档昆明理工大学信息工程与自动化学院学生实验报告( 2011 2012 学年 第 1 学期 )课程名称:人工智能开课实验室:信自楼计算机机房444 2011 年 12 月 16 日专业班级0 学号200 姓名成绩实验名称天气决策树指导教师教师评语该同学是否了解实验原理: A.了解B.基本了解 C. 不了解该同学的实验能力:A.强B.中等 C. 差该同学的实验是否达到要求:A.达到B.基本达到 C. 未达到实验报告是否规范:A.规范B.基本规范 C. 不规范实验过程是否详细记录:A.详细B.一般 C. 没有教师签名: 2011 年 12 月日一、上机目的及内容1. 上机内容根据下列给定的14

2、 个数据 , 运用 Information Gain构造一个天气决策树。例子编号属 性分类天况温度湿度风况1 晴热大无N 2 晴热大有N 3 多云热大无P 4 雨中大无P 5 雨冷正常无P 6 雨冷正常有N 7 多云冷正常有P 8 晴中大无N 9 晴冷正常无P 10 雨中正常无P 11 晴中正常有P 12 多云中大有P 名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 1 页,共 17 页 - - - - - - - - - 实用文档13 多云热正常无P 14 雨中大有N 2. 上机目

3、的(1)学习用 Information Gain构造决策树的方法;(2)在给定的例子上,构造出正确的决策树;(3)理解并掌握构造决策树的技术要点。二、实验原理及基本技术路线图(方框原理图或程序流程图)(1)设计并实现程序,构造出正确的决策树;(2)对所设计的算法采用大O符号进行时间复杂性和空间复杂性分析;主函数流程图:Attributevalue.cpp流程图名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 2 页,共 17 页 - - - - - - - - - 实用文档Basefu

4、n 流程图:Datapiont.cpp流程图:Dataset主要流程图:名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 3 页,共 17 页 - - - - - - - - - 实用文档三、所用仪器、材料(设备名称、型号、规格等或使用软件)1 台 PC及 VISUAL C+6.0软件四、实验方法、步骤(或:程序代码或操作过程)工程源代码:Main.cpp: #include #include #include 名师资料总结 - - -精品资料欢迎下载 - - - - - - - -

5、- - - - - - - - - - 名师精心整理 - - - - - - - 第 4 页,共 17 页 - - - - - - - - - 实用文档#include #include #include #include AttributeValue.h #include DataPoint.h #include DataSet.h DataPoint processLine(std:string const& sLine) std:istringstream isLine(sLine, std:istringstream:in); std:vector attributes; / TODO

6、: need to handle beginning and ending empty spaces. while( isLine.good() ) std:string rawfield; isLine rawfield; attributes.push_back( AttributeValue( rawfield ) ); 名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 5 页,共 17 页 - - - - - - - - - 实用文档AttributeValue v = att

7、ributes.back(); attributes.pop_back(); bool type = v.GetType(); return DataPoint(attributes, type); void main() std:ifstream ifs(in.txt, std:ifstream:in); DataSet initDataset; while( ifs.good() ) / TODO: need to handle empty lines. std:string sLine; std:getline(ifs, sLine); initDataset.addDataPoint(

8、 processLine(sLine) ); std:list processQ; std:vector finishedDataSet; 名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 6 页,共 17 页 - - - - - - - - - 实用文档processQ.push_back(initDataset); while ( processQ.size() 0 ) std:vector splittedDataSets; DataSet dataset = processQ.

9、front(); dataset.splitDataSet(splittedDataSets); processQ.pop_front(); for (int i=0; isplittedDataSets.size(); +i) float prob = splittedDataSetsi.getPositiveProb(); if (prob = 0.0 | prob = 1.0) finishedDataSet.push_back(splittedDataSetsi); else processQ.push_back(splittedDataSetsi); 名师资料总结 - - -精品资料

10、欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 7 页,共 17 页 - - - - - - - - - 实用文档 std:cout The dicision tree is: std:endl; for (int i = 0; i finishedDataSet.size(); +i) finishedDataSeti.display(); Attributevalue.cpp:#include AttributeValue.h #include base.h AttributeValue:AttributeVa

11、lue(std:string const& instring) : m_value(instring) bool AttributeValue:GetType() if (m_value = P) return true; else if (m_value = N) return false; else throw DataErrException(); 名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 8 页,共 17 页 - - - - - - - - - 实用文档Basefun.

12、cpp: #include float log2 (float x) return 1.0 / log10(2) * log10(x); float calEntropy(float prob) float sum=0; if (prob = 0 | prob = 1) return 0; sum -= prob * log2(prob); sum -= (1 - prob) * log2 ( 1 - prob ); return sum; Datapiont.cpp: #include #include DataPoint.h DataPoint:DataPoint(std:vector c

13、onst& attributes, bool type) : m_type(type) for (int i=0; iattributes.size(); +i) m_attributes.push_back( attributesi ); void DataPoint:display() for (int i=0; im_attributes.size(); +i) std:cout t m_attributesi.getValue(); 名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - -

14、 第 9 页,共 17 页 - - - - - - - - - 实用文档if (true = m_type) std:cout tP; else std:cout tN; std:cout std:endl; Dataset.cpp: #include #include #include base.h #include DataSet.h void SplitAttributeValue:display() std:cout tSplit attribute ID( m_attributeIndex )t; std:cout Split attribute value( m_v.getValu

15、e() ) std:endl; void DataSet:addDataPoint(DataPoint const& datapoint) m_data.push_back(datapoint); float DataSet:getPositiveProb() float nPositive = 0; for(int i=0; im_data.size(); +i) if ( m_datai.isPositive() ) nPositive+; return nPositive / m_data.size(); 名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - -

16、- - - - - - - - 名师精心整理 - - - - - - - 第 10 页,共 17 页 - - - - - - - - - 实用文档 struct Stat int nPos; int nNeg; int id; ; void DataSet:splitDataSet(std:vector& splittedSets) / find all available splitting attributes int nAttributes = m_data0.getNAttributes(); int i, j; std:vector splittingAttributeBV; spl

17、ittingAttributeBV.resize(nAttributes); for (i=0; inAttributes; +i) splittingAttributeBVi = true; for (i=0; im_splitAttributes.size(); +i) splittingAttributeBV m_splitAttributesi.getAttributeIndex() = false; std:vector splittingAttributeIds; for (i=0; inAttributes; +i) if (true = splittingAttributeBV

18、i) splittingAttributeIds.push_back(i); typedef std:map AttributeValueStat; typedef std:map:iterator AttributeValueStat_iterator; typedef std:map:const_iterator AttributeValueStat_const_iterator; / go through data once, and collect needed statistics to calculate entropy std:vector splittingStats; spl

19、ittingStats.resize( splittingAttributeIds.size() ); 名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 11 页,共 17 页 - - - - - - - - - 实用文档for (i=0; im_data.size(); +i) for (j=0; jsplittingAttributeIds.size(); +j) AttributeValue const& v = m_datai.getAttribute(splittingAtt

20、ributeIdsj); AttributeValueStat_iterator it = splittingStatsj.find(v); if ( splittingStatsj.end() = it ) Stat stat; if ( m_datai.isPositive() ) stat.nPos = 1; stat.nNeg = 0; stat.id = 0; else stat.nPos = 0; stat.nNeg = 1; stat.id = 0; splittingStatsj.insert(std:pair(v, stat); else if ( m_datai.isPos

21、itive() ) it-second.nPos+; else it-second.nNeg+; / display collected statistics for (j=0; jsplittingAttributeIds.size(); +j) std:cout Attribute( splittingAttributeIdsj ): std:endl; std:cout tValue t nPos t nNeg std:endl; for (AttributeValueStat_const_iterator it = splittingStatsj.begin(); it != spli

22、ttingStatsj.end(); +it) 名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 12 页,共 17 页 - - - - - - - - - 实用文档 std:cout t first.getValue() t second.nPos t second.nNeg std:endl; / find splitting attribute float minEntropy = 0.0; int splitAttributeId = -1; for (j=0; jsecond

23、.nPos + it-second.nNeg; float p = it-second.nPos; p /= nSamples; entropy += calEntropy(p) * nSamples / n; if (entropy minEntropy | -1 = splitAttributeId) minEntropy = entropy; splitAttributeId = j; std:cout Split at attribute( splittingAttributeIdssplitAttributeId ) std:endl second.id = k+; splitted

24、Sets.resize( k); for (i=0; ik; +i) for (j=0; jsecond.id.m_splitAttributes.push_back(SplitAttributeValue(itt-first, attrId); for (i=0; isecond.id.addDataPoint(m_datai); else throw DataErrException(); void DataSet:display() int i; std:cout Dataset( this ) std:endl; for (i=0; im_splitAttributes.size();

25、 +i) m_splitAttributesi.display(); std:cout Data: std:endl; for (i=0; im_data.size(); +i) m_datai.display(); std:cout std:endl; 五、实验过程原始记录 ( 测试数据、图表、计算等) 名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 14 页,共 17 页 - - - - - - - - - 实用文档名师资料总结 - - -精品资料欢迎下载 - - - - - -

26、 - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 15 页,共 17 页 - - - - - - - - - 实用文档六、实验结果、分析和结论(误差分析与数据处理、成果总结等。其中,绘制曲线图时必须用计算纸或程序运行结果、改进、收获)Attributevalue.cpp的作用是判断正反例, 以便下面的的划分决策过程, basefun.cpp的作用则是计算熵,通过熵的比。较才能够为下面的划分提供条件依据, 而 dataset.cpp就是具体的划分过程,首先找到可用的划分项目,再第一次划分之后再手机相关的数据来计算熵。之后再显示出来,做这个实验的时候我遇到了很大的难度,感觉它的要求和自己的实际水平相差很大,所以参考了很多资料才得以完成这个程序,也感觉到了自己的能力还很不足,还需要加强的地方还有很多。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 16 页,共 17 页 - - - - - - - - - 实用文档名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 17 页,共 17 页 - - - - - - - - -

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 高考资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁