《基于数据挖掘技术的智能化数据分析系统设计与开发.doc》由会员分享,可在线阅读,更多相关《基于数据挖掘技术的智能化数据分析系统设计与开发.doc(2页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、“大众网-大学生创新项目基金”2014年度选题指南基于数据挖掘技术的智能化数据分析系统设计与开发一、 项目背景目前在我国,“数据海量,信息缺乏”是很多行业在数据爆炸过程中普遍所面对的尴尬。很多企业的数据库只能实现数据的录入、查询、统计等较低层次的功能,却无法发现数据中存在的各种有用的信息。数据挖掘又称数据库中的知识发现,一般是指从大量的数据中自动搜索隐藏于其中的有着特殊关系性的信息的过程,是目前人工智能和数据库领域研究的热点问题。数据挖掘是一种决策支持过程,它主要基于人工智能、机器学习、模式识别、统计学、数据库、可视化技术等,高度自动化地分析企业的数据,做出归纳性的推理,从数据库的大量数据中揭
2、示出隐含的、先前未知的并有潜在价值的信息,从中挖掘出潜在的模式,帮助决策者调整市场策略,减少风险,做出正确的决策,目前已广泛应用于科学、工程、商业、医学等领域。数据挖掘主要有数据准备、规律寻找和规律表示3个步骤,常见功能包括关联分析、聚类分析、分类分析、异常分析、特异群组分析和演变分析等等。市场上种类丰富的数据挖掘软件工具也为这一应用的普及提供了很好的技术支撑。注意:并非所有的信息发现任务都被视为数据挖掘。例如,使用数据库管理系统查找个别的记录,或通过因特网的搜索引擎查找特定的Web页面,则是信息检索领域的任务。虽然这些任务是重要的,可能涉及使用复杂的算法和数据结构,但是它们主要依赖传统的计算
3、机科学技术和数据的明显特征来创建索引结构,从而有效地组织和检索信息。二、 提交要求l 自主选定问题的行业应用背景及本次数据挖掘针对的问题;l 各赛队自行获取数据挖掘所需的大量数据;l 数据挖掘工具可自选;l 针对数据挖掘产生的结果请从应用角度进行解释,并说明该结果对于问题决策的意义;l 要求提供开发文档,详细描述开发过程及所有中间结果、最终结果。三、 提交规范作品必须以光盘形式上交,在根目录下建立三个文件夹,分别命名为“作品”、“源程序”、“文档”,必要时自己根据情况建立二级文件夹并清晰命名。1、将作品的完整运行版即发布版本放入“作品”文件夹中。2、将作品的源程序放入“源程序”文件夹中。3、将
4、完整的技术文档、管理文档和系统说明文档(必备软件安装和使用说明书)都放到“文档”文件夹中。注意在文件中应逐条详细说明体现作品设计特色的功能。四、 评比方式提交的材料完整、齐全、可读性好。如果所提交的文档不完整,仍可以参加评比,但要适当扣分。评比首先要看程序是否能正常运行,即运行中出现的错误不能使程序退出、陷入死循环或造成死机。如果出现上述情况,可以重新运行,但总尝试次数不能超过三次。作品展示效果占比分的20%,功能及创意为80%。在正常运行基础上,以功能评比为主,在功能相近的情况下,考察程序的其他特色,重点看创意,以鼓励学生创新性思维。首先考察程序是否包含指定的基本功能,其次考察程序的其它创意功能和创意设计。若某项功能运行不正常,算做无此功能,不影响其他功能评比。作品要求至少要兼容Google Chrome、Firefox浏览器。经过演示、报告、答辩后,给出最终成绩。五、 联系方式作品完成过程中遇到的问题,可以与命题老师联系。命题人:臧文科命题单位:山东师范大学联系电话:13864191208联系QQ:328612842联系Mail:zwker