《基于邻域粗糙集与鱼群智能的基因选择方法.pdf》由会员分享,可在线阅读,更多相关《基于邻域粗糙集与鱼群智能的基因选择方法.pdf(6页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、 第 47 卷 第 1 期 电 子 科 技 大 学 学 报 Vol.47 No.1 2018年 1月 Journal of University of Electronic Science and Technology of China Jan. 2018 基于邻域粗糙集与鱼群智能的基因选择方法 陈玉明1,2,朱清新2,曾志强1,孙金华1,唐朝辉1,2(1. 厦门理工学院计算机与信息工程学院 福建 厦门 361024; 2. 电子科技大学计算机科学与工程学院 成都 611731) 【 摘要 】 针对高维、小样本及不确定性的基因表达数据,融合模糊可容忍性的邻域粒化技术与具有全局寻优能力的鱼群智能
2、算法,提出基于邻域粗糙集与鱼群智能的基因选择方法。首先,采用邻域粗糙集对基因数据进行邻域粒化,形成邻域粒子;其次,提出基于邻域分类精度的不确定性评价函数,用以评价邻域粒子的不确定性,分辨关键性基因;进一步融合鱼群智能方法,设计一种基因选择算法,选取分类性强的少量关键基因;最后,在两个癌症基因数据集中进行基因选择,采用 SVM分类器对获取的关键基因组进行分类实验。实验结果表明,采用该方法获取的基因组具有较低的冗余度及较好的分类性能。 关 键 词 鱼群算法 ; 基因选择 ; 粒计算 ; 邻域粗糙集 ; 粗糙集 中图分类号 TP181 文献标志码 A doi:10.3969/j.issn.1001-
3、0548.2018.01.015 Gene Selection Method Based on Neighborhood Rough Sets and Fish Swarm Intelligence CHEN Yu-ming1,2, ZHU Qing-xin2, ZENG Zhi-qiang1, SUN Jin-hua1, and TANG Chao-hui1,2(1. School of Computer and Information Engineering, Xiamen University of Technology Xiamen Fujian 361024; 2. School o
4、f Computer Science and Engineering, University of Electronic Science and Technology of China Chengdu 611731) Abstract Facing the gene expression data with high dimension, small samples and uncertainty, a gene selection method based on neighborhood rough sets and fish swarm intelligence is proposed b
5、y fusing a fuzzy tolerance granulation technology and a fish swarm intelligence algorithm with global optimization ability. Firstly, the neighborhood rough sets are used to granulate the gene data and form some neighborhood particles. Secondly, the neighborhood classification accuracy is presented a
6、s an uncertainty evaluation function that aims to judge these neighborhood particles and distinguish key genes. Furthermore, a gene selection algorithm based on artificial fish swarm intelligence is designed. Finally, some gene selection experiments are carried out on two tumor gene data sets. The c
7、lassification experiments of a small number of selected key genes are conducted by using SVM classifier. The experimental results show that the genes selected by our proposed method have a low redundancy and a better classification performance. Key words fish swarm algorithm; gene selection; granula
8、r computing; neighborhood rough sets; rough sets 收稿日期: 2016 - 11 - 28;修回日期: 2017 - 03 - 30 基金项目:国家自然科学基金 (61573297);福建省自然科学基金 (2015J01277) 作者简介:陈玉明 (1977 - ),男,博士,副教授,主要从事粗糙集、基因数据分析及特征选择方面的研究 . 微阵列技术的快速发展积累了大量的基因表达数据。基因表达数据具有高维、小样本及不确定性的特点。用传统的统计分析方法与机器学习方法选择最佳基因时,往往陷入维数灾难的困境1。基因选择是从众多的基因中选择一个基因子集使得
9、基因样本分类最优化。基因子集的评价依赖于具体的评价函数。根据评价函数的不同,基因选择方法主要分为两类: Filter方法 (筛选器 )2和 Wrapper方法 (封装器 )3。 Filter方法不依赖于具体的分类器,根据度量准则筛选出最优的基因子集。常用的度量方法有 t检验4、信息增益5、距离度量6、相关性分析7等。依据上述度量方法评估每个基因或多个基因与类别的相关性,按照相关性从高到低排序,选择排在前面的少数基因作为最佳基因组。这类方法简单、时间复杂度低,但没有考虑基因的分类性能,使得选择后的基因子集冗余度高, 分类精度不是特别理想。Wrapper方法以分类精度为评价标准, 在所有的基因子集
10、中搜索,以分类精度最高的基因子集作为基因选择的结果。按照搜索策略的不同,基因选择可分为前向选择8、后向删除9、启发式搜索10等算法。Wrapper方法获取的基因子集分类性能较好,冗余度低,但时间复杂度较高,存在过拟合的现象。 万方数据 电 子 科 技 大 学 学 报 第 47 卷 100粒计算是智能信息处理的一种新方法,涵盖粗糙集11、邻域粗糙集12、模糊集13、商空间14、覆盖粗糙集15等理论,能够处理不同粒度层次上的不精确、不完整与不确定的数据。邻域粗糙集以 邻域构造上下近似集来度量一个不确定性的集合。文献 16提出了基于邻域粗糙集的邻域分类算法, 并把该方法应用于特征选择领域12。文献
11、5研究了模糊粗糙集的不确定性度量,并成功应用于癌症基因的选择。文献 17研究了邻域粗糙集与神经网络模型,并用于基因表达数据的分类研究。 文献 18提出的鱼群算法具有并行性、跟踪性、随机性、简单性的特点,是一种解决全局优化问题的有效工具。这种方法模仿自然界鱼群觅食行为,采用自下而上的寻优模式,通过鱼群中各个体的局部寻优,使得全局最优值在群体中突现出来。 面对高维、冗余、不确定性的基因表达数据,需要降低基因数据的复杂性,建立具备并行计算能力的基因选择理论与方法。为此,针对基因数据分析系统存在的维数灾难与不确定性问题,提出了基于邻域粗糙集与鱼群智能的基因选择方法。采用邻域关系粒化连续型的基因表达数据
12、,利用鱼群智能算法提高基因选择的并行处理能力与寻优能力,设计基于邻域粒化与鱼群智能的基因选择算法。在两个高维基因数据集上进行基因选择,并对选择的基因进行了分类实验。 1 邻域粗糙集粒化与基因选择 对于广泛存在的连续型基因数据分析系统,引入邻域粗糙集模型16粒化连续型的基因数据,用于基因选择领域。 定义 1 设五元组 IS (,)UAVf= 为邻域基因表达数据系统,其中 U 为基因样本集, A表示有限个基因,aA aVV= ,aV 表示基因 a 的表达水平值域, :f UA V是一个信息映射函数,即对,x Ua A ,有 (,)af xa V , 0,1 为邻域粒化参数。 定义 2 设五元组 I
13、S (,)UAVf= 为邻域基因表达数据系统,对于任一基因样本 ,x yU , 基因子集 BA ,其中 B=a1,a2, ,an,定义 B 上的距离函数 (, )BD xy满足如下条件: 1) ( , ) 0BDxy, 非负; 2) ( , ) 0BDxy= , 当且仅当 x y= ; 3) ( , ) ( , )BBD xy D yx= , 对称; 4) ( , )BD xy+ (,) (,)BBD yz D xz ,三角不等式。 其中1/1(, ) (| (, ) (, )|)pnpBiiiDxy fxa fya=-,当 1p = 时,称为曼哈顿距离,当 2p = 时,称为欧氏距离。 定义
14、 3 设五元组 IS (,)UAVf= 为邻域基因表达数据系统,对于任一基因样本 x U ,基因子集 BA ,定义 x在 B 上的 邻域 ()Bnx为: () | , , (, ) BBnx yxyUDxy= 根据距离函数的定义,邻域 ()Bnx满足性质: 1) ()Bnx ; 2) ()Bx nx ; 3) ()Bynx ()Bx ny ; 4) ()xU Bnx U= 。 定义 4 设五元组 IS (,)UAVf= 为邻域基因表达数据系统,任一基因子集 BA 决定了一个邻域参数 上的邻域关系 NR ( )B: NR ( )B= ( , ) | ( , ) Bxy U U D xy 。 /N
15、R ( )UB构成了 U的一个邻域划分,称其为 U 上的一簇邻域知识,其中邻域划分的子集称为一个邻域类或者邻域知识。上述邻域 ()Bnx即为一个邻域类。 定义 5 设 DT ( , , , , )UC DV f= 为邻域基因表达数据决策表,其中 C 为基因集合,其值为连续型的数据,邻域参数为 ,其邻域划分为12/NR ( ) , , , mUCXXX= , D 为决策分类信息,为离散型的数据,以等价关系划分为12/,nUD YY Y= 。 定义 6 设 DT ( , , , , )UC DV f= 为邻域基因表达数据决策表, BC , XU , 记 /NR ( )UB= 12, , ,iBB
16、B , 则称*() | /NR(),iiBX BB U B= iBX 为 X 关于 B 的邻域下近似集,称*()BX= | /NR(), ii iBB U BB X 为 X 关于 B 的邻域上近似集。 定义 7 设 DT ( , , , , )UC DV f= 为邻域基因表达数据决策表。定义 D 对 C 的邻域分类精度为*() | ()| |CD CD U = ,其中 |U 表示集合 U 的 基数。 定义 8 设 DT ( , , , , )UC DV f= 为邻域基因表达数据决策表,对 bBC ,若 ()BD ()BbD-,则称 b 为 B 中相对于 D 是必要的;否则称 b 为 B 中相对
17、于 D 是不必要的。对 BC ,若 B中任一元素相对于 D 都是必要的,则称 B 相对于 D是独立的。 定义 9 设 DT ( , , , , )UC DV f= 为邻域基因表达数据决策表, 若 BC , () ()BCD D = 且 B相对于 D 是独立的,则称 B 是选取的关键基因组,万方数据 第 1期 陈玉明,等 : 基于邻域粗糙集与鱼群智能的基因选择方法 101 这一过程称为邻域基因选择。 性质 1 设 DT ( , , , , )UC DV f= 为邻域基因表达数据决策表,若12BB C ,则120() () ()1BB CDD D 。 根据定义 9可知, 基因选择过程即是保持邻域分
18、类精度不变的基因冗余降低过程, 性质 1说明邻域分类精度具有单调性的特点。 关键基因组可能有多个,其中基数最小的为最优关键基因组, 其冗余度最小。最优关键基因组的计算与搜索过程是一个典型的优化问题,可采用启发式搜索方式求解,但容易陷入局部最优。因此,下面引入鱼群智能优化原理,用于最优关键基因组的搜索过程。 2 基于鱼群智能的基因选择方法 2.1 鱼群智能优化原理 基因表达数据集具有高维的特点,设基因表达数据集有 n个基因, 则基因的组合就达到 2n种方式,搜索空间达到指数级别。采用穷举法搜索出最优的关键基因组,显然是不可行的。而启发式贪婪搜索方法却很容易陷入局部解。鱼群算法具有较好的全局寻优能
19、力与优越的并行计算的特点18,因此,有必要采用鱼群算法搜索出最佳的关键特征组。 鱼群算法是一种模拟鱼群觅食行为的群智能算法,主要涉及鱼群的 3种行为:觅食行为、聚集行为与追尾行为18。 1) 觅食行为 鱼觅食时总是在自己可视的邻域范围内往食物浓度高的地方游动。觅食行为数学上表示如下: next( ) , FS FS| |jiijijiXXXXRSXX-=+ -, next()iXXRS=+ 式中,iX 表示一条鱼所处的 i 位置,代表目前的解;nextX 表示鱼要选择的下一个位置,表示下一个更优的解; ()RS 表示随机移动步长; FSi表示位置 i 的食物浓度。 如果满足 FS FSj i
20、, 则鱼向食物浓度高的 j位置的方向上游动一步,否则,向随机方向游动一步。 2) 聚集行为 鱼聚集时总是在自己可视的邻域范围内往鱼群的中心位置游动,条件是中心位置食物浓度高且并不拥挤。聚集行为数学上表示如下: next() , FS FS| |ciiciciXXXXRSXX-=+ -, and /snn-, and /snn=3) 评价函数 基于鱼群优化的基因选择算法中,每条人工鱼分头并行去寻找最优基因子集。基因子集的评价采用邻域分类精度与基因子集长度的加权值作为评价函数,定义如下: 万方数据 电 子 科 技 大 学 学 报 第 47 卷 102|fitness( ) * ( ) (1 )|R
21、C| RXDC =+-式中, |C 表示所有的基因个数; |R 表示选择的基因个数; 0,1 表示权重参数。 4) 搜索停止过程 最佳关键基因组的搜索过程是一个不断迭代的过程,每次迭代随机生成 k 条人工鱼,分头去寻找局部最优解,迭代一次完成后获得暂时的全局最优解, 当迭代次数达到最大值或全局最优解连续 3次迭代都不再进化时,搜索关键基因组过程停止,输出全局最优解。 2.3 基于邻域粒化与鱼群智能的基因选择算法 根据邻域粗糙集理论和鱼群智能搜索原理,提出基于邻域粗糙集与鱼群智能的基因选择算法,具体描述如下: 算法 1 NFSAGS (neighborhood and FSA based gen
22、e selection) 输入: 基因表达数据集 DS ( , , , , )UC DV f= ,最大迭代次数 maxcycle 。 输出: 最优关键基因组 minR 及基因个数 minL 。 1) 初始化 minRC= , min |C|L = ; 2) 对基因表达数据进行邻域粒化,形成粒域类,并计算邻域正域 POS ( )CD; 3) 计算邻域分类精度 ()CD = |POS ( ) | | |CD U; 4) 若迭代次数 t 小于 maxcycle 或者未达到满意解,则循环执行如下操作: 产生 k 条人工鱼,kR = ; 每条人工鱼分别随机选择一个基因ka ,kkkRRa= ; 每条人工
23、鱼并行循环搜索下一个最佳基因: a. 每条人工鱼分别执行觅食行为Search( )s kRR= 、聚集行为 Swarm( )wkRR= 和追尾行为 Follow( )f kRR= ;选择评价函数最大值max(fitness( ),fitness( ),fitness( )kswfRRRR= , 并计算其邻域分类精度 ()kRD ; b. 若C() ()kRD D = 或者 | minkRL ,则第k 条人工鱼结束其搜索过程; 若C() ()kRD D = 并且 |minkRL ,则更新全局解 minkRR= , min | |kLR= ; 迭代数 1tt=+; 5) 输出最佳基因组 minR
24、和基因个数 minL 。 在算法 NFSAGS中,主要涉及评价函数与邻域分类精度的计算,而这些计算与邻域类相关。文中采用文献 19中 Hash排序的方法计算邻域类,邻域类计算时间降为线性。除了邻域类的计算之外,外层循环还有迭代次数和人工鱼条数。因而,最坏情况下, NFSAGS算法的时间复杂度为 ()Ok t m n ,其中 k 为人工鱼的条数, t 为迭代的次数, m 为基因的个数, n为样本的个数。其中步骤 3)过程可并行计算,因此,时间复杂度可降为 ()Ot m n。 3 实验结果与分析 为验证算法的有效性,实验分别采用文献 20中的基于邻域粗糙集的基因选择方法 (SGSA)和本文算法 (
25、NFSAGS)进行基因选择, 并比较选择后基因的冗余度与分类效果。 算法性能评估采用如下方法:1) 冗余度的比较,评估算法的基因选择能力; 2) 分类精度的比较,评估选择基因的分类能力。基因数据集采用两个公开的基因表达数据集 Colon和SRBCT。 1) 结肠癌数据集 (Colon):该数据集共包含 62例样本,其中 40例为结肠癌组织样本、 22例为正常组织样本,每例样本由 2 000个基因表达数据组成。 2) 小圆蓝细胞肿瘤数据集 (SRBCT):该数据集共包含 63例样本, 4种类别,其中 EWS类 23例, RMS类 20例, NB类 12例和 BL类 8例,每例样本由 2 308个
26、基因组成。 3.1 冗余度分析 为了分析选择基因的冗余程度,定义冗余度来表示选择基因的精简程度,表示如下: |redundancy 100%|RC= 式中, |C 表示基因数据集的基因个数; |R 表示基因选择后的基因个数。冗余度越小,精简的效果越好。实验中,邻域粒化采用欧式距离,邻域粒化参数 从 0.05变化到 0.95,每次变化的间隔是 0.05。NFSAGS算法中人工鱼的个数为 20,每条人工鱼向周围试探游动的次数为 20,迭代次数为 20。实验结果如图 1和图 2所示。 由图 1中的实验结果可知,在 Colon基因表达数据集中, NFSAGS基因选择算法和 SGSA基因选择算法都随邻域
27、参数的增大,其选择基因组的冗余度逐步增大。 NFSAGS算法在邻域参数 从 0.05变化到0.95区间,冗余度增加缓慢,而 SGSA算法在邻域参数 =0.7时,冗余度增大为 1。由图 2中可知,在SRBCT基因表达数据集中,冗余度的变化也呈现类万方数据 第 1期 陈玉明,等 : 基于邻域粗糙集与鱼群智能的基因选择方法 103 似图 1的特点, NFSAGS算法选择的基因组冗余度增加缓慢,而 SGSA算法在邻域参数 =0.95时,冗余度增大为 1。冗余度越小,选择的基因个数越少,当冗余度为 1时,全部基因是选择的基因。因此,实验表明基于鱼群智能的基因选择算法具有较好的基因精简效果和寻优能力。 1
28、.00 冗余度0.04 0.03 0.02 0.01 0 0.05 0.15 0.25 0.35 0.45 0.55 0.65 0.75 0.85 0.95邻域参数 SGBA 基因选择算法MFSAGS 基因选择算法 图 1 Colon数据集中被选基因的冗余度随邻域参数变化曲线 1.00 冗余度0.04 0.03 0.02 0.01 0 0.05 0.15 0.25 0.35 0.45 0.55 0.65 0.75 0.85 0.95邻域参数 SGBA 基因选择算法MFSAGS 基因选择算法 图 2 SRBCT数据集中被选基因的冗余度随邻域参数变化曲线 3.2 分类精度分析 为了比较 NFSAG
29、S基因选择算法与 SGSA基因选择算法中被选择基因的分类精度,采用 SVM分类器进行测试。因基因数据具有样本少的特点,因此分类精度的计算采用留一交叉验证法。每次提取一个样本作为测试样本, 将剩余的 n-1个样本作为训练集,训练 SVM分类器并用于测试提取的样本。然后,再轮流提取另一个样本, 直到所有样本都测试一遍,最终的分类精度由分类正确的样本数与样本总数之比得到。实验结果如图 3和图 4所示,表示分类精度随邻域参数变化的曲线。 1.0分类精度0.40.30.20.100.05 0.15 0.25 0.35 0.45 0.55 0.65 0.75 0.85 0.95邻域参数 SGBA 基因选择
30、算法MFSAGS 基因选择算法0.80.70.60.50.9图 3 Colon数据集中被选基因的分类精度随邻域 参数变化曲线 1.0分类精度0.40.30.20.100.05 0.15 0.25 0.35 0.45 0.55 0.65 0.75 0.85 0.95邻域参数 SGBA 基因选择算法MFSAGS 基因选择算法0.80.70.60.50.9图 4 SRBCT数据集中被选基因的分类精度随邻域 参数变化曲线 从图 3可知,在 Colon数据集中, NFSAGS算法在邻域参数 为 0.5和 0.8时分类精度达到最大值,为93.55%; 而 SGSA算法在邻域参数 为 0.35和 0.4时分
31、类精度达到最大值,为 91.93%。在整个邻域参数变化期间, NFSAGS算法选择基因的分类精度有 11次高于 SGSA算法, 8次低于 SGSA算法。因此,在数据集 Colon中, NFSAGS算法比 SGSA算法能够获得更好的分类性能。 从图 4可知,在 SRBCT数据集中, NFSAGS算法在邻域参数 为 0.4时分类精度达到最大值,为100%,这时选择出 7个基因,这和文献 21中的结果相同; SGSA算法在邻域参数 为 0.35时分类精度达到最大值,也为 100%,这时选择出 6个基因,略好于文献 21中的结果。而在整个邻域参数变化期间,NFSAGS算法选择基因的分类精度有 8次高于
32、 SGSA算法, 5次低于 SGSA算法, 6次相同分类精度。从以上分析可知, NFSAGS算法和 SGSA算法都具有较好万方数据 电 子 科 技 大 学 学 报 第 47 卷 104的精简效果和分类性能, 在整个邻域参数变化期间,NFSAGS算法的分类性能略好于 SGSA算法。 4 结 束 语 本文将人工鱼群智能算法引入基因选择领域,并采用邻域粗糙集模型进行邻域粒化,在粒计算理论的框架中提出基于邻域粗糙集与鱼群智能的基因选择方法,并给出了适用于基因表达数据的基因选择算法。该算法充分利用邻域粗糙集粒化连续型数据的优势,发挥鱼群智能算法全局寻优及并行计算的特点,引入汉明距离度量人工鱼群之间的距离
33、,给出了鱼群中心点的计算方法,并应用于基因选择研究。目前,采用鱼群算法的方法进行基因选择的研究还很少见,本文的研究拓展了粗糙集与软计算理论研究的应用范围,为基因选择研究提供了一条新的途径。理论分析及实验结果表明基于邻域粒化与鱼群智能的基因选择算法是有效可行的。 参 考 文 献 1 SAEYS Y, INZA I, LARRANAGA P. A review of feature selection techniques in bioinformaticsJ. Bioinformatics, 2007, 23(19): 2507-2517. 2 TIBSHIRANI R, HASTIE T, N
34、ARASIMHAN B, et al. Diagnosis of multiple cancer types by shrunken centroids of gene expressionJ. Proceedings of the National Academy of Sciences, 2002, 99(10): 6567-6572. 3 KOHAVI R, JOHN G H. Wrappers for feature subset selectionJ. Artificial Intelligence, 1997, 97(1-2): 273-324. 4 JAFARI P, AZUAJ
35、E F. An assessmernt of recently published gene expression data analyses: Reporting experimental design and statistical factorsJ. BMC Medical Informatics and Decision Making, 2006, 6(27): 1-8. 5 DAI J H, XU Q. Attribute selection based on information gain ratio in fuzzy rough set theory with applicat
36、ion to tumor classificationJ. Applied Soft Computing, 2013, 13(1): 211-221. 6 WONG T T, LIU K L. A probabilistic mechanism based on clustering analysis and distance measure for subset gene selectionJ. Expert Systems with Applications, 2010, 37(3): 2144-2149. 7 张丽娟 , 李舟军 . 微阵列数据癌症分类问题中的基因选择 J. 计算机研究与
37、发展 , 2009, 46(5): 794-802. ZHANG Li-juan, LI Zhou-jun. Gene selection for cancer classification in microarray dataJ. Journal of Computer Research and Development, 2009, 46(5): 794-802. 8 LIN H Y. Gene discretization based on EM clustering and adaptive sequential forward gene selection for molecular
38、classificationJ. Applied Soft Computing, 2016, 48: 683-690. 9 PUDIL P, NOVOVICOVA J, KITTLER J. Floating search methods in feature selectionJ. Pattern Recognition Letters, 1994, 15(11): 1119-1125. 10 GUYON I, ELISSEEFF A. An introduction to variable and feature selectionJ. Journal of Machine Learnin
39、g Research, 2003, 3: 1157-1182. 11 PAWLAK Z. Rough setsJ. International Journal of Information and Computer Sciences, 1982, 11(1): 341-356. 12 HU Q H, YU D R, LIU J F, et al. Neighborhood rough set based heterogeneous feature subset selectionJ. Information Sciences, 2008, 178: 3577-3594. 13 ZADEH L
40、A. Fuzzy setsJ. Information and Control, 1965, 8: 338-353. 14 ZHANG L, ZHANG B. Fuzzy reasoning model under quotient space structureJ. Information Sciences, 2005, 173(4): 353-364. 15 ZHU W, WANG F Y. Reduction and axiomization of covering generalized rough setsJ. Information Sciences, 2003, 152(1):
41、217-230. 16 HU Q H, YU D R, XIE Z X. Neighborhood classifiersJ. Expert Systems with Applications, 2008, 34: 866-876. 17 明利特 , 蒋芸 , 王勇 , 等 . 基于邻域粗糙集和概率神经网络集成的基因表达谱分类方法 J. 计算机应用研究 , 2011, 28(12): 4440-4444. MING Li-te, JIANG Yun, WANG Yong, et al. Gene expression profiles classification method based o
42、n neighborhood rough set and probabilistic neural networks ensembleJ. Application Research of Computers, 2011, 28(12): 4440-4444. 18 李晓磊 , 邵之江 , 钱积新 . 一种基于动物自治体的寻优模式 : 鱼群算法 J. 系统工程理论与实践 , 2002, 22(11): 32-38. LI Xiao-lei, SHAO Zhi-jiang, QIAN Ji-xin. An optimizing method based on autonomous animals:
43、 Fish swarm algorithmJ. Systems Engineering-Theory & Practice, 2002, 22(11): 32-38. 19 LIU Y, HUANG W L, JIANG Y L, et al. Quick attribute reduct algorithm for neighborhood rough set modelJ. Information Sciences, 2014, 271: 65-81. 20 MENG J, ZHANG J, LUAN Y. Gene selection integrated with biological
44、 knowledge for plant stress response using neighborhood system and rough set theoryJ. IEEE/ACM Transactions on Computational Biology, 2015, 12(2): 433-444. 21 PAL N R, AGUAN K, SHARMA A, et al. Discovering biomarkers from gene expression data for predicting cancer subgroups using neural networks and relational fuzzy clusteringJ. BMC Bioinformatics, 2007, 8(1): 1-18. 编 辑 蒋 晓 万方数据