《2022年股票时间序列数据关联规则挖掘研究报告.docx》由会员分享,可在线阅读,更多相关《2022年股票时间序列数据关联规则挖掘研究报告.docx(13页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、精选学习资料 - - - - - - - - - 个人资料整理 仅限学习使用南昌高校 2003 级硕士学位论文文献综述报告基于股票时间序列数据的关联规章挖掘争论Study on Mining Association Rules from Stock Time Series Data 系 别: 运算机科学与技术系专 业: 运算机应用技术争论方向: 人工智能研 究 生: 汪廷华导 师: 程从从 教授)2005 年 03月名师归纳总结 - - - - - - -第 1 页,共 10 页精选学习资料 - - - - - - - - - 个人资料整理 仅限学习使用一引言随着运算机信息系统的日益普及,大容
2、量储备技术的进展以及条形码等数据猎取技术的广泛应用,人们 在日常事务处理和科学争论中积存了大量的各种类型的数据;在这些数据中,有很大一部分是出现时间序列time series)类型的数据;所谓时间序列数据就是按时间先后次序排列各个观测记录的数据集 1 ,如金融证券市 场中每天的股票价格变化;商业零售行业中,某项商品每天的销售额;气象预报争论中,某一地区的每天气 温与气压的读数;以及在生物医学中,某一症状病人在每个时刻的心跳变化等等;然而,我们应当留意到:时间序列数据不仅仅是历史大事的记录,更重要的是隐藏这些数据其中不显现的、好玩的模式;随着时间推 移和时间序列数据的大规模增长,如何对这些海量数
3、据进行分析处理,挖掘其背后隐藏的价值信息,对于我 们揭示事物进展规律变化的内部规律,发觉不同事物之间的相互关系,为人们正确熟悉事物和科学决策供应 依据具有重要的实际意义;时间序列数据分析依据不同的任务有各种不同的方法,一般包括趋势分析、相像性搜寻、与时间有关数据的序列模式挖掘、周期模式挖掘等2 ;本综述是针对证券业中股票时间序列分析的,试图通 过 列 举 、 分析有关证券业中股票时间序列数据分析的原理、方法与技术,着重探讨数据挖掘中基于股票时间序列数据的 关联规章挖掘的概念、原理技术、实施过程及存在的障碍和问题,以期能有新的发觉和领会;二股票时间序列传统争论方法概述随着我国市场经济建设的进展,
4、人们的金融意识和投资意识日益增强;股票市场作为市场经济的重要组 成部分,正越来越多地受到投资者的关注;目前股票投资已经是众多个人理财中的一种重要方式;不言而 喻,假如投资者能正确猜测股票价格、选准买卖时机,无疑会给投资者带来丰厚的收益;于是,在股票的预 测和分析方面显现了大量的决策分析方法和工具,以期能有效地指导投资者的投资决策;目前,我国股市用 得较多的方法概括起来有两类 3 :一类是基本分析和技术分析,另一类是经济统计分析;1基本分析和技术分析 在股票市场上,当投资者考虑是否投资于股票或购买什么股票时,一般可以运用基本分析的方法对股市 和股票进行分析;而在买卖股票的时机把握上,一般可以运用
5、技术分析的方法 4 ;基本分析指的是通过对影响股票市场供求关系的基本因素如宏观政治经济形势、金融政策、行业变动、公司运营财务状况等)进行分析,来确定股票的真正价值,判定将来股市走势,是长期投资者不行或缺 的有效分析手段;技术分析是完全依据股市行情变化而加以分析的方法,它通过对历史资料 成交价和成交量)进行分 析,来判定大盘和个股价格的将来变化趋势,探讨股市里投资行为的可能转折,从而给投资者买卖股票的信 号,适合于投资者作短期投资;目前技术分析常用的工具是各种各样的走势图 K 线图、分时图)和技术指 标MA、RSI、OBV等);2经济统计学分析 主要针对时间序列数据进行数学建模和分析;传统的时间
6、序列数据分析已经是一个进展得相当成熟的学 科,有着一整套分析理论和工具,是目前时间序列数据分析的主要方法,它主要用经济统计学的理论和方法 对经济变量进行描述、分析和推算;传统时间序列数据分析的争论目的在于 5 : 分析特定的数据集合,建立数学模型,进行模式结构分析和实证争论; 猜测时间序列的将来进展情形;传统的时间序列数据分析最基本的理论是40岁月分别由 Norbor Wiener和Andrei Kolmogomor 提出的; 20世纪 70岁月, G.P.Box和G.M.Jenkins发表专著时间序列分析:猜测和掌握,对平稳时间序列数据提出了自回来滑动平均模型ARMA ),以及一整套的建模、
7、估量、检验和掌握方法,使得时序数据分析得以广泛运用于各种工程领域;其基本思想是依据各随机变量间的依存关系或自相关性,从而 由时间序列的过去值及现在值来猜测出将来的值;该模型以证券市场为非有效市场为前提,当期的股票价格名师归纳总结 - - - - - - -第 2 页,共 10 页精选学习资料 - - - - - - - - - 个人资料整理 仅限学习使用变化不仅受当期随机因素的冲击,而且受前期影响;换句话说,就是历史信息会对当前的股票价格产生肯定程度的影响;采纳的方法一般是在连续的时间流中截取一个时间窗口一个时间段),窗口内的数据作为一个数据单元,然后让这个时间窗口在时间流上滑动,以获得建立模
8、型所需要的训练集 6 ;7 基于股票时间序列是一种混沌时间序列的认知,提出一种新奇的非线性时间序列猜测模型,即滑动窗口二次自回来 MWDAR )模型,该模型使用部分的历史数据及其二次项构造自回来模型,模型参数用最小二乘法估量;其基本理论基础是:一个线性模型不能描述混沌时间序列的全局性特点,但在一个小的时间间隔内,系统的行为却可以用某种线性模型近似;8 就提出了一种基于嵌入理论和确定集上的猜测误差的混沌时间序列猜测方法,并探讨了在股票价格猜测上的应用;可以看出,经济统计学为问题的探究解决方案供应了有用而实际的框架;模型是经济统计学的核心,模型的挑选和运算往往被认为是次要的,是建立模型的枝节;经济
9、统计学本质上是从事“确定性 ”分析的,可以 说统计方法是 “ 目标驱动 ” 的;但是,在大量数据集中往往存在一些未被人们预期到但又具有价值的信息,人们为发觉大量数据中隐匿的规律和模式,就需要新的具有 一门工具;“ 探干脆 ” 的分析工具;明显,数据挖掘就是这样的三数据挖掘技术应用于股票时间序列分析的争论现状数 据 挖 掘 DM, Data Mining ) , 也 称 为 数 据 库 中 的 知 识 发 现 KDD, Knowledge Discovery in Database )是数据库技术和机器学习等人工智能技术相结合的产物,是一门新兴的数据智能分析技术 9 ;20 世纪 80 岁月末,
10、随着数据库、互联网技术的快速进展以及治理信息系统 MIS)和网络数据中心 IDC)的推广应用,数据的存取、查询、描述统计等技术已日臻完善,但高层次的决策分析、学问发觉等有用技术仍很不成熟,导致了“ 信息爆炸” 但“ 学问贫乏” 的现象;到了90 岁月,人们提出在数据库基础上建立数据仓库,应用机器学习和统计分析相结合的方法处理数据,这两者的结合促成了数据挖掘技术的产生;所谓数据挖掘,简洁地说,就是从大量数据中提取或挖掘学问2 ;具体一点可以描述为主要利用某些特定的学问发觉算法,在肯定的运算效率的限制下,从大量的数据中抽取出潜在的、有价值的学问 模型、规章和趋势)的过程;挖掘算法的好坏直接影响到学
11、问发觉的质量和效率,因此目前大多数争论都集中于数据挖掘算法及其应用上;1相关技术介绍1)关联规章挖掘关联规章是美国IBM Almaden Research Center的Rakesh Agrawal 等人于 1993年第一提出来的KDD 争论的一个重要课题10 ;关联规章挖掘本质是从大量的数据中或对象间抽取关联性,它可以揭示数据间的依靠关系,依据这种关联性就可以从某一数据对象的信息来推断另一对象的信息;它可以做如下形式化定义:设I=i1,i2,.,im是一组项的集合 ;D中的每个事务 T是项的集合,且满意 T I;称事务 T支持物品集 X,假如 X T;关联规章是如下形式的一种蕴含式: XY,
12、其中 X I,Y I,且 XY=;1 称关联规章 XY在事务数据库 D中具有大小为 s的支持度,假如物品集X Y 的支持度为 s%,即 supportX Y=PX U Y ;2 称规章 XY 在事务数据库 D中具有大小为 c的可信度,假如D中支持物品集 X 的事务中有 c%的事务同时也支持物品集Y,即 confidenceX Y=PY|X ;从语义的角度来分析,规章的可信度表示这条规章的正确程度;支持度表示用这条规章可以推出百分之 几的目标,即这一规章对于整体数据的重要程度;用户可以定义二个阈值,要求数据挖掘系统所生成的规章 的支持度和可信度都不小于给定的阈值;这样,就用包蕴式、支持度和可信度
13、唯独标识了每一个挖掘出来的 关联规章;名师归纳总结 已知事物数据库D,关联规章的挖掘问题就是产生支持度与置信度分别大于用户给定的最小阈值的全部第 3 页,共 10 页- - - - - - -精选学习资料 - - - - - - - - - 个人资料整理 仅限学习使用关联规章;该问题分两步来求解:第一步是找出事务数据库D中全部满意条件的具有用户指定最小支持度的工程集;具有最小支持度的工程集称为频繁项集;其次步是从频繁项集中构造可信度不低于用户要求的规就 ; 形 式 地 , 对 于 每 一 个 频 繁 工 程 集A , 找 出A的 所 有 非 空 子 集a , 如 果 比 率supportA/s
14、upportamin _conf ;识别或发觉全部的频繁项集是关联规章挖掘算法的核心,也是运算量最大的部分;目前已有不少挖掘频繁项集的方法,其中最闻名的是 R.Agrawal 和 R.Srikant 提出的 Apriori 算法 11 ,其核心是利用这样一个性质:频繁项集的全部非空子集都是频繁的;基于这样的先验学问,Apriori 使用一种“ 逐层搜寻“ 的迭代方法, k- 项集用于探究 k+1)项集;第一找出频繁 1- 项集,记作 L1;用 L1 找频繁 2- 项集 L2;而 L2 用于找L3,如此下去,直到不能找到频繁 k- 项集;虽然 Apriori 算法能最终挖掘出全部的关联规章,但由
15、于处理的数据量特别大,因而算法的效率显得十分重要;后来的一些争论人员对算法的连接和剪枝过程进行各种优化;如12 提出了称为 AprioriTid 的改进算法,该算法提出了在每一步 第一步除外)运算候选频繁项集的支持度时不需要浏览整个事务数据库;它认为不包含任何 k- 项集的事务不行能包含任何 k+1 项集,这样,这种事务在其后的考虑时,可以加上标记或删除,由于为产生 们;该算法的本质是压缩进一步迭代扫描的事务数;j- 项集 16 关联规章挖掘算法就是这样的算法,它们在性能上均获得了突破,与 Apriori 算法相比,挖掘效率有了数量级的提高;利用 FP-Tree 可以压缩事务数据集,压缩有的达
16、到 100 多倍;而树投影方法从原理上讲是适应任何数据集的,无论其据量多大该算法都能有效运行,从而使得关联规章挖掘可以应用于海量数据的挖掘和稠密数据集的挖掘;除了上述关联规章挖掘的经典算法之外,人们着重在以下几个方面对关联规章进行了争论;1)连续通过各种手段提高挖掘效率;这方面包括对原有算法的进一步改进 17,18;提出一些并行挖掘算法 19,20、增量算法 21 以及带约束的关联规章挖掘策略 元规章制导关联规章挖掘)22,23;2)不同形式关联规章的争论;关联规章最早是由购物篮分析开头的,但是随着争论的扩展和深化,关联规章的应用范畴不断扩大,因此显现了多种形式关联规章的争论;由最简洁的单维、
17、单层、布尔关联规章逐步向复杂形式扩展;在基本关联规章的基础上提出了布尔型加权关联规章和广义模糊型加权关联规章算法24 ,由单层的关联规章扩展为多层次关联规章的争论25 等等;关联规章形式的多样化,反映了人们从不同角度熟悉同一事物的不同视点,加深了对关联规章的熟悉与争论;3)结合其它理论 如软运算理论)对关联规章进行争论;引入粗糙集概念,使关联规章发觉的模式具有较高的说明才能和精确度 26 ;通过引入神经网络的概念,提出用相互激活与竞争网络来进行数据库中的关联规章的发觉 27 ;仍有基于遗传算法的多维关联规章挖掘 28 等;可以看出通过引入其他领域的先进理论,丰富了关联规章争论的内容,提高了算法
18、的有效性;和主观评判指标 新奇性、用户感爱好性和简洁性 , 在此基础上给出了一种关联规章的综合自动评价方法;5 )关联规章的应用争论;理论从实践中来,但最终是为了指导实践;关联规章自提出以来,经过无名师归纳总结 - - - - - - -第 4 页,共 10 页精选学习资料 - - - - - - - - - 个人资料整理 仅限学习使用数学者的争论努力,广泛应用于社会生产和科研的各个方面,产生了庞大的效益 30,31,32,33 ;2)序列模式挖掘序列模式 Sequential Pattern)挖掘最早也是由 R.Agrawal 第一提出来的 34 ;设有一个交易数据库D,每个顾客可在不同时间
19、购买不同物品,每次购买活动称为交易 Transaction);这里,顾客、交易时间和所购物品分别以 Customer_ID 、Transaction_Time 和 Itemset 标识;假如以 Customer_ID 为第一关键字,Transaction_Time 为其次关键字对数据库 D 排序,那么,对每一顾客而言,他进行的全部交易是以交易时间的升序排列的,从而构成一个序列,称这种序列为顾客序列CS,于是该顾客的CS序列为 itemsett1, itemsett2, itemsett3, , itemsettn;相应地,可以认为上述交易数据库D 已转换为顾客序列数据库;假如某序列 s 包含在
20、某顾客的 CS 序列中,那么称该顾客支持 Support )该序列 s;某序列的支持度为支持该序列的顾客数与顾客序列数据库中顾客总数之比;序列模式就是在上述顾客序列数据库中满意用户指定最小支持度的最长序列;序列模式的问题定义与关联规章很相像,它们之间的区分可以用以下例子描述,关联规章描述的是在一次购物中所购买物品之间的关联关系,而序贯模式就是描述同一顾客在不同次购物所购物品之间可能存在的某种关联关系;换句话说,关联规章仅仅发觉事务内部 intra-transaction)的模式,而序列模式就是发觉事务之间 inter-transaction)的模式;序列模式的发觉方法与关联规章的发觉方法大致相
21、同,R.Agrawal 在 Apriori 算法的基础上提出了三个序 列 模 式 的 挖 掘 算 法 AprioriAll、AprioriSome 和DynamicSome34 ;AprioriAll 算法采纳哈希树储存候选序列,将全部的候选序列均储存在哈希树的叶子节点中;将候选序列的记数划分为向前及向后两阶段:向前阶段跳动性地产生全部特定长度的频繁序列,而向后阶段找出在向前阶段未考虑的频繁序列;在 3536 中提出了挖掘具有概念分层、滑动时间窗口及最大和最小时间约束的 GSPGeneralized Sequential Patterns)算法;该算法也采纳哈希树储备候选序列,仍将候选序列的记
22、数分为向前及向后阶段,但此法划分向前阶段与向后阶段的目的与实现均与 AprioriAll 算法不同;Sequential PSPPerfectly Patterns)算法在 37 中提出,该算法采纳了前缀树结构而非哈希树)储备候选序列,从而导致该算法的候选序列集的产生和记数均不同与 GSP算法; 同时,由于前缀树的每个节点只 储备事务中的一项,故与哈希树结构相比较大的节约了内存空间;3)软运算方法 软运算 Soft Computing )是方法论的集合,这些方法集相互协作,并以一种形式或其它某种形式为现实中的模糊情形提 供敏捷信息处理功 能 38 ;它的目的是为了获得易处理的、粗糙的、低成本的
23、解决方法而对不确定的数据进行处理;遵从的原就是以追求近似解决模糊/精确问题,并低成本地设计解决方案;软运算方法主要包括模糊规律、Rough集、遗传算法、神经网络等;模糊规律是处理不确定性概念及其推理机制的过程,Rough集和神经网络常被用来分类和规章抽取,遗传算法包括最优解和搜寻过程,像问题最优解和样本挑选;针对时间序列挖掘,软运算方 法的应用争论简要介绍如下:模糊规律是最早、应用最广泛的软运算方法,模糊规律的进展导致了软运算方法的显现;39 在挖掘时间序列数据时使用了模糊语言概化;掘时间序列模式算法;40 针对商业销售的智能分析需求,提出了一种基于模糊集合的数据挖神经网络是一个黑箱问题,它从
24、前被认为不适合应用于数据挖掘,且在符号格式中,它并不能获得有用 信息,但却适合进行说明;近年来,挖掘训练过的网络中的嵌入学问,已广泛地应用于数据挖掘中;它对属 性或逐个或合并地进行判别,这对于决策或分类是特别重要的;它对数据挖掘的奉献是在规章提取和自组织名师归纳总结 - - - - - - -第 5 页,共 10 页精选学习资料 - - - - - - - - - 个人资料整理 仅限学习使用性上;遗传算法是可调剂的、鲁棒的、有效率的搜寻方法,它适应于搜寻大空间集;它相对数据挖掘的标准来优化功能,并达到搜寻最优解的目的;41 提出了一个基于小生境遗传算法和模式缓存的时间序列中频繁结构模式的发觉算
25、法,该算法具有轻巧、敏捷、可扩展性好的特点,可依据实际情形合理配置运算时间和所占 用的内存资源,可实现挖掘结果的实时动态更新输出,并通过在在实际时间序列数据上的试验证明白该算法 的有效性;Rough 集理论由波兰规律学家Pawlak 教授在 20 世纪 80 岁月提出,是一种处理模糊和不确定问题的新型数学工具,其动身点是依据目前已有的对给定问题的学问将问题的论域进行划分,然后对划分的每一部分 确定其对某一概念的支持程度:即确定支持此概念,确定不支持此概念和可能支持此概念,并分别用三个近 似集合来表示为正域、负域和边界;它能有效地分析不精确、不一样、不完整等各种不完备的信息,仍可以对数据进行分析
26、和推理,从中发觉隐含的学问和潜在的规律;同时,余信息等方面有着良好的成效,因此广泛应用于数据挖掘的数据预处理 42,43;股票时间序列挖掘Rough 集理论在处理大数据量,排除冗 数据约简)、规章生成等方面股票市场高风险和高收益并存,因此对于股票数据学问发觉的争论始终受到人们的关注;目前对股票时 间序列的数据挖掘方法大致集中在以下三个方面;1)相像性的争论;该方法是在时间序列数据库中找出与给定查询序列最接近的数据序列,它包含了全序列匹配和子序列匹 配两种问题;子序列匹配就是找出与给定模式序列相像的全部子序列,而全序列匹配就是找出彼此间相像的 序列;具体的操作时将时间窗口在时间序列上滑动,通过距
27、离运算从一个时间序列和多个时间序列中查找相 似的时间序列模式进行聚类形成相像组群,当有一个新的时间序列需要分析时,可以从相像组群中查找与它最相像的类来匹配;一般有两个争论方向,一种是将时间序列从时间域time domain )到频率域 frequency domain)后在进行相像性匹配;至于为什么要进行这种数据变换,主要是基于很多信号分析技术 如离散傅立叶变换 DFT 和离散小波变换 DWT)需要数据来自频率域 2 ;另一种就是直接在时间域上争论;主要应用是从股票数据中识别具有相像变化趋势的模式,以猜测新数据在将来的进展行为;在时间序列相像性方面的争论文献有 44,45,46,47;2)趋势
28、分析与值猜测争论;趋势分析争论时间序列的变化趋势,其理论基础是将时间序列视为一个动力系统,认为在其过去的波动中蕴涵有可用于猜测将来的信息;给定一组值 /n , /n , /n , ;移动平均可以降低数据集中的变化总量,用移动平均替代时序,可以削减不期望显现的波动,故它也称为时序的平滑;另一种是最小二乘法,即以最好的拟合曲线 C 作为最小二乘曲线,即曲线具有最小的,其中偏差或误差 di 是指点 x i,y i)的值 yi 与对应曲线 C的值之间的差值;趋势分析可以用来值猜测,除此之外,用得较多的是神经网络 48,49;这种猜测方法由于是基于时间序列的具体数值,而这些数据往往含有很多干扰数据,因此
29、该值猜测方法的抗干扰才能较弱;3)时间序列中关联规章的抽取;Gautam Das 等对从时间序列中发觉关联规章进行了争论50 ,这里规章是对时间序列中不同模式间关系的一种描述,50 的主要奉献在于给出了一个将原始时间序列转换成有各个模式表示符组成的符号序列的一般方案,该方案由三部分组成,即分割,聚类和符号替换;然后采纳序列模式发觉算法实现了符号序列中规章的发觉;针对股票时间序列的特别性,很多学者在经典关联规章挖掘算法的基础上,又提出了很多新的算法;名师归纳总结 1996 年 R.Strikant给出了关系数据库中数量关联规章的挖掘算法51 ;1998 年 H.Lu 对股票变动的猜测以第 6 页
30、,共 10 页- - - - - - -精选学习资料 - - - - - - - - - 及内联相关性分析进行了争论个人资料整理仅限学习使用53 ;52 ;1999 年 M.Garofalakis提出了具有约束限制的时序数据挖掘2002 年 Y.Chen 对时序数据库的多维回来分析进行了争论54 ;国内学者在这方面也做了相当的争论,55对股票时间序列的挖掘,分别探讨了一维和二维关联规章的发觉;56 通过一个具体的实例描述了从股票时间序列中挖掘一维关联规章的方法;57 提出了推迟关联规章的概念,并在股票时间序列上实现挖掘该规章的算法; 58 在时间序列中引入多重时间粒度,以模糊规章的形式给出数据
31、挖掘的结果;Rough 集理论在数据挖掘领域的应用主要表达在数据约简和关联规章的抽取上,这方面的争论已经有了少量的文献;59 提出的一种基于 Rough 集的时间序列数据挖掘策略,明显适用于股票时间序列的挖掘;60 就提出将正就化神经网络与 Rough 集理论相结合应用于股票时间序列数据库的挖掘;该方法融合了正就神经网络优良的泛化性能和 Rough 集理论的规章生成才能,充分展现了软运算方法应用于时间序列数据分析的新奇性;四总结与展望从大的方面来说,时间序列数据的挖掘技术可分为统计分析法和数据挖掘;众所周知,统计学是数据挖掘的三大支柱之一 :78 84.7 李爱国,覃征 . 滑动窗口二次自回来
32、模型猜测非线性时间序列 . 运算机学报,第 27 卷,第 7 期 2004 年 7 月.8 孙宏义,朱梅 . 混沌时间序列猜测及在股票市场中的应用 . 安徽工程科技学院学报,第 18 卷,第 4 期 2003 年 12 月 .9 李菁菁,邵培基,黄亦潇 . 数据挖掘在中国的现状和进展争论 . 治理工程学报 2004 年第 3 期 . 10 R.Agrawal, T.Imielinski, A.Swami. Mining Association Rules Between Sets of Items in Large DatabasesC. Proceedings of ACM SIGMOD I
33、nt1 Conf. Management of Data, Washington D.C., 1993.207 216. 11 R.Agrawal, R.Srikant. Fast Algorithms for Mining Association RulesJ. VLDB94, Santiago, Chile,1994:478 499.12 Mannila H, Toivonen, Inkeri Verkamo A. Efficient algorithms for discovery association rules. In Proceedings of AAAI Workshop on
34、 Knowledge Discovery in database. July 1994.181 192.13 Hannu Toivonen, Mika Klemettinen, Pirjo Ronkaine etal. Pruning and grouping discovered association rules. In Mlnet workshop on Statistics, Maching Learning and Discovery in Database. Heraklion, Rete. April 1995.14 Agrawal R, Srikant R. Fast Disc
35、overy of Association Rules. In Fayyad. 1996.15 J.Han, J.Pei. Mining Frequent Patterns Without Candidate Generation. In Proc. 2000ACM-SIGMOD Intl. Conf. on Management of DataSIGMOD 2000 Dallas TX 2000 ,1 12.16 R.Agarwal, C.Aggarwal, V.Prasad. A Tree Projection Algorithm for Generation of FrequentItem
36、sets. Journal of Parallel and Distributed Computing Special Issue on High PerformanceData Mining 2001,350-371.17 倪旻 ,徐晓飞 ,邓胜春 ,赵政 . 基于频繁工程对支持矩阵的Apriori 优化算法 .小型微型运算机系统.Vol.25 No.5, May 2004.18 邓砚谷 ,王丽珍 . 对 FP-Tree 头表节点数据结构的改进.运算机工程与应用. 2004,25.19 R.Agrawal, J.Shafer. Parallel Mining of Association R
37、ules. IEEE Trans.On Knowledge andData Engineer 1996,962 969.名师归纳总结 20 张兆功 ,李建中 ,张艳秋 .海量数据上挖掘关联规章的并行算法. 哈尔滨工业高校学报,2004 年 05期.第 8 页,共 10 页21 朱红蕾 ,李明 . 一种高效保护关联规章的增量算法. 运算机应用争论,2004 年 09期. 22 M.Kamber,J.Han, J.Y.Chiang. Metarule-Guided Mining of Multi-Demensional AssociationRules Using Data Cubes In Pr
38、oc.1997 Intl. Conf. Knowledge Discovery and Data Minin KDD1997 Newport Beach CA. 1997,207-210.23 程继华,郭建生,施鹏飞. 元规章指导的学问发觉方法争论. 运算机工程与应用,1999 年第 10 期.24 陆建江 . 数据库中布尔型及广义模糊型加权关联规章的挖掘.系统工程理论与实践,2002,2:28 32.25 程继华 ,施鹏飞 . 多层次关联规章的有效挖掘算法.软件学报 ,1998,912:937941.- - - - - - -精选学习资料 - - - - - - - - - 个人资料整理 仅限学习使用26 程 岩 ,黄梯云 .粗糙集中定量关联规章的发觉及其规章约简的方法争论 .治理工程学报 ,2001,153:73 77.27 倪志伟 ,蔡庆生 ,方瑾 .用神经网络来挖掘数据库中的关联规章 .系统仿真学报 ,2000,126:685 687.28 高坚 . 基于免疫遗传算法的多维关联规章挖掘 . 运算