您的当前位置:首页正文

一种基于遗传算法的聚类集成方法

2021-10-02 来源:好走旅游网
ComputerEngineering andApplications计算机工程与应用 一种基于遗传算法的聚类集成方法 王丙景,高茂庭 WANG Bingjing,GAO Maoting 上海海事大学信息工程学院,上海201306 College of Information Engineering,Shanghai Maritime University,Shanghai 20 1 306,China WANG Bingjing,GAO Maoting.New model for clustering ensemble based on genetic algorithms.Computer Engineering and Applications,2013,49(8):164—168. Abstract:Clustering ensemble algorithms require higher differences among clustering components,which induce higher com— plexity during the generating phase of clustering components.This paper proposes a new model for Clustering Ensemble based on Genetic Algorithm(CEGA),which does not need to consider the differences between clustering components,but translates clustering into optimization of clustering components by calculating target function,and optimizes the grouping of clustering components by genetic algorithms.CEGA sets the final optimal chromosome to be the result of clustering and its complexity and application are also analyzed.Experimental results demonstrate the effectiveness of the proposed method on several UC1 datasets. Key words:cluster ensembles;genetic algorithms;clustering components 摘要:聚类集成算法通常对聚类成员差异性要求较高,导致算法在生戍聚类成员阶段计算复杂度提高。针对该问题提 出了一种基于遗传算法的聚类集成方法CEGA,不考虑聚类成员的差异性,而是利用目标函数将聚类问题转化为聚类成员 的优化问题,充分利用遗传算法内在的并行性和全局寻优能力,对聚类成员进行优化组合,并以得到的最优染色体作为聚 类集成最终结果。分析了CEGA的复杂度及适用范围,并利用UCI数据库中部分数据集进行实验,实验结果表明这种聚 类集成方法的有效性。 关键词:聚类集成;遗传算法;聚类成员 文献标志码:A 中图分类号:TP181 doi:10.3778 ̄.issn.1002—8331.1109—0190 l 引言 重取样技术 。这种技术虽然能提高聚类的效果,但同时 聚类集成 是指综合多种不同基聚类算法或同一种基 却增加了生成聚类成员的计算成本。 聚类算法的多个版本来解决同一个聚类问题,可以显著地 文献[7]将遗传算法用于聚类集成,并将聚类成员集作 提高聚类算法的泛化能力。聚类集成在保护私有信息、知 为目标,利用基于信息理论的准则函数计算染色体与聚类 识重用和分布式汁算中有着重要的应用 。 成员的距离,在随机产生的染色体种群中找到一个与所有 设数据集D={d ,d 一,d }包含n个数据对象,聚类集 聚类成员距离和最小的聚类结果。但其中存在两个问题; 成的过程 L般包括两个步骤:首先,对数据集D执行 次 (1)聚类成员结果不可能是完全正确的 ’ 。,将不完全正确 聚类算法,得到 个聚类结果,仃= , ,…, },7g,(以 的聚类成员作为目标所产生的最优染色体,其聚类结果不 一定是最好的。(2)其初始种群由随机产生的染色体组成, 下称聚类成员)为第i次的聚类结果;然后,采用合适的一 这种初始群体是杂乱的,必定需要多次进化,大大增加进 致性方法F对Jr7中的聚类结果进行整合得到一个新的一 化时间。针对以上问题,本文提出一种基于遗传算法的聚 致性结果7/" 。 类集成方法CEGA(Clustering Ensemble model based on 在聚类集成中,聚类成员的差异性通常被认为是影响 Genetic Algorithm),将聚类成员集合作为遗传算法的初始 集成最终结果的重要关键因素之一 ,近年来出现了许多通 种群,将聚类结果综合评价指数OCQ 作为目标函数,得到 过提高聚类成员差异性来改善聚类效果的方法,如Bagging 的最优染色体为聚类集成最终结果。这样既避免了聚类 基金项日:上海海事大学校基金项目(No.20100092)。 作者简介:王丙景(1987一),男,硕士研究生,主要研究领域为数据挖掘;高茂庭(1963 ),男,博士,教授,CCF高级会员,主要研究领域为 数据挖掘、数据库与管理信息系统。E—mail:wan in舀ing1987@163.tom 收稿日期:2011—09—13 修回日期:2011-11—02 文章编号:1002—8331(2013)08—0164—05 CNKI出版H期:2012-01-16 http://www.cnki.net/kcms/detail/11.2127.TP.20120116.0928.051.html 王丙景,高茂庭:一种基于遗传算法的聚类集成方法 成员的差异性分析,同时聚类结果综合评价指数客观地分 析聚类结果质量,使进化朝着聚类效果好的方向发展,提 高了聚类效果。 本文在生成聚类成员时没有对差异性作具体要求,主 要是基于以下两点:(1)生成的聚类成员要作为遗传算法的 初始种群(详见3.3.1节),种群中每个染色体要表示成一个 完整的聚类结果,这要求每个聚类成员必须包含数据集中 全部的数据对象,而类似Bagging的重取样技术得到聚类 成员并不能包含所有的数据对象。(2)遗传算法中的进化 理论完全可以体现出聚类成员差异性,在最极端的情况 下,生成的Ⅳ个聚类成员都相同时,可以利用突变函数使 种群出现新的染色体,经过进化仍然可以得到最优的聚类 结果。 2遗传算法基本原理 遗传算法是模拟生物进化规律的一种随机化搜索方 法,其直接对结构对象进行操作,具有内在的并行性和全 局寻优能力;采用概率化的寻优方法,能自动获取和指导 优化的搜索空间,自适应地调整搜索方向[10-11] ̄ 遗传算法的基本步骤包括: 步骤1选择编码方式,设定交叉率、突变率,以及进化 代数Gen=O。 步骤2初始化种群得到P(Gen)。 步骤3根据目标函数计算种群中每个染色体的适应度。 步骤4 Gen=Gen+l。 步骤5若Gen到达设定的条件,则转向步骤11,否则 转向步骤6。 步骤6从P(Gen一1)中选出两个成员,选出的概率与 染色体的适应度成正比。 步骤7按照预先设定的杂交率,从每个选中染色体的 一个随机确定的点上进行杂交。 步骤8按照预选设定的变异率,从每个选中染色体上 随机确定一个点,把相应的位值改变。 步骤9选择新产生的个体和P(Gen一1)群体中适应度 大的染色体组成种群P(Gen)。 步骤10转到步骤3。 步骤11输出种群P(Gen)中适应度最高的个体,算法 停I匕。 3基于GA的聚类集成 聚类集成中最困难的是找到一个一致性函数将聚类成 员进行整合,目前存在许多一致性函数,如投票法、超图划 分、基于共协矩阵的证据积累、概率积累等。本文将遗传 算法作为一致性函数,利用遗传算法全局搜索能力找到最 优的聚类结果。 CEGA算法的主要思想:在对数据集执行H次聚类算 法(如K-means),生成 个聚类成员刀={7g ,7g 一,7g }后, 基聚类得到的聚类成员并不完全正确 ,可以将聚类成员量 化为式(1): 7g ={D ,D『F) (1) 其中,D 表示第f个聚类成员中聚类正确的数据对象集合, D 表示第f个聚类成员中聚类错误的数据对象集合,且D U D =D。当算法对D 进行交叉或突变时,目标函数会得 到适应度较差的染色体;当算法对D 进行交叉或突变时, 目标函数会得到适应度较好的染色体,利用精英选择函 数,使种群保留适应度较高的染色体,种群的进化集中在 适应度较高的染色体上,得到适应度最好的染色体作为最 终的聚类结果。 3.1 CEGA算法基本框架 CEGA算法遵循一般聚类集成的两大阶段:聚类成员 生成阶段和聚类成员集成阶段,在聚类成员生成阶段加入 聚类成员簇标号统一算法。CEGA算法的基本框架如下: 聚类成员生成阶段:对原始数据集执行Ⅳ次聚类算法 (比如K-means),得到初始聚类成员H = , ,…,7g r}; 利用最大覆盖法u 对初始聚类成员簇标号进行统一,得到 聚类成员集合,7={7g , …,7r }。 聚类成员集成阶段:将仃= ,7g .., }作为遗传算 法的初始种群,根据第2章介绍的遗传算法步骤进行进化, 得到最优染色体为最终聚类结果。 CEGA算法流程如图1所示。 对原始数据集执行日次K-means聚类 I 生成初始聚类成员集合 』 统一初始聚类成员簇标号 j 生成聚类成员集合 』 初始化种群、令Gen=O l 根据目标函数计算个体适应度 ● t 1 I突变产生新个体 I保存最优个体I I变异产生新个体 ● 产生下一代种群、令Gen=Gen+l 否 \ / I是 选择最优个体为最终聚类结果 图1 CEGA算法流程图 3.2聚类成员生成阶段 在这一阶段,采用常用的K-means算法来生成聚类成 员,在对原始数据集D={ ,d ,…, 执行 次聚类(参数 为后),得到聚类成员集合H ={ ,7g ,…,丌Ⅳ },仃 为日×n Computer Engineering and Applications计算机工程与应用 二维数组,其中: 7t ={c ,c …,c i∈[1,刎 (2) OCQ聚类综合评价指数 是Ji He等人提出的,将聚类 密集性和聚类分离性结合的一种聚类相对评价方法。OCQ 定义为: OCQ(1f)=l一( ・Cmp+(1一 )・Sep) (5) c ,/l∈[1,,z]为第 次聚类结果中第 个数据对象所属的簇标 号,1≤C.i≤k。 然而,由此得到的聚类成员Jr7 中, (f∈【1,HI)与 , 其中,Cmp表示聚类密集性,Sep表示聚类分离性。 为平 衡系数,且0< <1,用来权衡聚类密集性和聚类分离性的 比重。不同的数据集取不同的 值。Cmp定义为: (, [1,H],l,≠i)没有可比性,不能直接用于遗传算法进行优 化。例如,对于聚类成员 =[1,1,1,3,3,2,2,1]和792f= 【2,2,2,1,1,3,3,2]来说,虽然它们的内容不一样,但它们 表示同一种聚类结果,因此,必须对聚类成员簇标号进行 c =吉砉 (6) 其中,c是聚类个数,Dev(c )是类c 的方差,Dev(D)是类 统一。周志华等提出的最大覆盖法对聚类成员簇标号进 行统一,认为有对应关系的聚类簇集所覆盖的相同对象的 个数应该是最大的。两个聚类成员7/" 和7t" 分别把原数据 集划分为尼个簇集,分别用聚类标记{c c …,c 和 {c c …,c 表示。首先,将这两个聚类成员中每一 对簇集c 和c 所覆盖的相同对象的个数记录在k×k的 OVERLAP矩阵中,然后,选择其中覆盖相同对象个数最大 的簇集建立对应关系,并将其结果从OVERLAP矩阵中移 除。重复以上过程,直到所有簇集都建立了对应关系为止。 此时,聚类成员集合变化如式(3): H ={7r1 , 2 ,‘一,丌 } 仃={丌1,丌2,…,7C } (3) 其中, ={c ,c ,…,c },i∈[1,H],C,t为统一后的簇标号 (非簇集)。 3.3聚类成员集成阶段 在聚类成员集成阶段,引入遗传算法,将聚类成员集 合作为遗传算法的初始种群,聚类结果综合评价指数OCQ (Overall Cluster Quality)作为目标函数引导种群进化,设 定与代数相关的突变率和杂交率。然而,简单遗传算法不 是全局收敛的,带有最优个体保留的遗传算法才是全局收 敛的 。因此,加入精英选择函数来保留适应度最高的染 色体,使算法具有全局收敛性,同时提高进化速率。下面 介绍各项参数的具体内容。 3.3.1染色体编码 聚类成员集合采用实数编码方式进行编码,实数编码 可以有效地缩短染色体长度,实数编码计算方便,避免了 不 进制之间的转换,降低计算复杂度。每个聚类成员作 为一条染色体,聚类成员中簇标号为染色体基因 。很显 然,原始数据集中数据对象的个数为染色体长度。式(4) 表示一条染色体: :{c ,c ,…,c:},i∈[1, ] (4) 其中,C 为统一后的簇标号。 3.3.2 目标函数 遗传算法的目标函数非常重要,目标函数引导群体的 进化方向,使染色体向着有利于问题解决的方向发展。聚 类问题的解是要找到一个聚类结果,使相似的数据对象划 分到同一簇,相异的数据对象划分到不同簇。采用聚类结 果综合评价指数来计算每条染色体的聚类效果并返回一 个适应度。 D的方差。函数Dev(X)定义为: 。ev( ) :i1 N: 2,; , x , x-))  (7) 其中,Ⅳ是数据集 中的数据对象个数, = ∑ , ( , ) 是X 和 .的距离。根据聚类结果应保证类内相似性最大 的原则,为了使簇内数据尽可能更加紧凑,聚类密集性应 越小越好。Sep定义为: , C C d ,X) Sep 一,: ‘ ] (8) 其中, 是高斯常量,为方便计算,通常设2 =1,X 和X, 分别是类C.与C.的聚类中心。根据聚类结果应保证类间 相似性最小的原则,为了使簇间数据尽可能更加分开,聚 类分离性应越小越好。由Cmp和Sep的定义可知,聚类结 果综合评价指数OCQ值越大,表明聚类效果越好。 3.3.3 没定杂交函数及突变雨数 在进化过程中,算法经常会收敛到局部最优点,达不 到全局最优的效果,为此,增加了与进化代数相关的交叉 率和突变率 。 ,以提高算法的全局搜索能力。 杂交函数定义如式(9): PCtPcfGen1=emp,Pctemp “ (9) 其中,Pc 。=Pc ×2‘-G 柏 ,Pc…为预没的最大交 叉率,尸c…为预设的最小的交叉率,确保交叉率介于最小 值与最大值之间变化。 突变函数定义如式(10): Protemp'PmtJp ml 尸 (Gen)=e P (10) 其中,P 。 1 ×尸 …, 一尸 . 分别 为预设定的突变率的最大值和最小值。 算法中种群的进化关键在突变函数的处理,利用突变 函数的随机性对错误聚类的数据进行重新分类。如某个体 编码为{1,1,1,2,2,2,3,3,3,1},即第1、2、3、10个数据被 分为一簇,第4、5、6个数据被分为一簇,第7、8、9个数据被 分为一簇,而正确的分类结果编码为{1,1,1,2,2,2,3,3, 3,3},这时利用突变函数对第10个数据编号进行突变,当 突变正确时,染色体适应度会提高,算法保存最优个体,重 王丙景。高茂庭:一种基于遗传算法的聚类集成方法 复进化直至最优染色体适应度不在变化。虽然依靠突变 函数进化种群有一定的盲目性,但实验表明只要目标函数 正确,适当提高算法的突变率和种群大小,进化速率和进 化结果是乐观的。 4.2 对比算法 实验采用标准K-means、SOM、SCE 和CEGA算法进 行实验对比。 标准K-means算法的目标是将包含Ⅳ个对象的数据集 3.3.4精英选择函数 为保存种群进化过程中产生的最优个体,在算法中增 加了精英选择函数 ,即将种群中适应度最高的 个个体 直接选入下一代,来保存优良基因。精英选择在本实验中 尤为重要,对适应度高的个体进行进化可以有效地减少遗 传算法进化代数从而提高进化速率。实验表明,当 大小 分为 个簇,使同一簇内具有较高的相似度,而不同簇问相 似度较低。算法先任意选择 个对象作为初始的簇中心, 再计算每个对象与各个簇中心的距离并将其赋给最近的 簇,更新簇的平均值,不断重复此过程直到准则函数收敛。 SOM(自组织特征映射)是由输入层和竞争层构成的 双层神经网络。输入层由Ⅳ个神经元构成,用于接受外部 为种群数量的2%~10%时,进化效果最好。 3-3.5算法复杂度分析 算法设定原始数据D包含n个数据对象,每个数据对 象有m个属性,原始数据集有 个簇,一次基聚类需t次循 环,基聚类成员个数为H。由CEGA算法步骤,绝大部分处 理都集中在适应度的计算上,算法在产生聚类成员阶段的 计算复杂度为O(kntHm),聚类成员簇标号统一过程的计 算复杂度为0(Hkn),进化阶段计算复杂度为0(MaxGen× Hxk×,z xm)。综上,CEGA算法计算复杂度为O(MaxGen× H× n ) 4实验与结果分析 4.1数据集和评价标准 实验采用UCI(University of California,Irvine)的机器 学习库中的部分数据集作为实验数据集。表1给出了这些 数据的样本、属性和类别数量。 表1 实验数据集的样本、属性和类别数量 选用的聚类结果评价标准是Micro-precision 标准,使 用此标准测试聚类结果正确率。其计算公为: = 其中,a 表示对数据某一类分类正确的数量,Ⅳ表示数据 集中数据对象的数量, 表示此数据集和中的类别的数 量。为了更好地衡量聚类的正确率,要进行重复的实验, 采用平均正确率来衡量聚类将更准确。所以使用式(12) 计算 : . , k (12) 其中, 为重复实验的次数,本文选为10次。 输入模式,即Ⅳ维数据向量。竞争层(输出层)通常排列成 一个1维或2维的平面阵列,由 个神经元构成,用于将输 入层的节点映射到竞争层节点上。输入层的所有节点和 竞争层所有节点用权值W进行连接,且连接权值在网络训 练过程中动态更新。 SCE(半监督聚类集成)旨在将半监督学习和聚类集成 相结合来提高聚类效果。SCE是阐述聚类成员与聚类集成 结果变量之间的依赖关系的贝叶斯网络,先采用一部分数 据作为训练数据来确定整个数据集的初始化参数a和b,根 据SCE的EM算法找到最优的a和b使得聚类成员中最大 对数似然 估计,最后通过参数将聚类成员转化成聚类 集成结果。 4.3实验结果 表2给出了标准K.means、SOM、SCE和CEGA算法聚 类成功率的对比结果。在九个数据集中,CEGA有7次表 现良好,仅在Pima和Wdbc数据集上稍微落后于SCE。但与 单一的聚类算法相比,CEGA能大幅提高聚类的成功率。 表2各算法在数据集 的聚类 成功率对比结果 (%) 本文还设计了另外一组实验,在聚类成员生成阶段, CEGA与Bagging、Bootstrap及Subsampling在五个数据集 上的性能比较。Bagging、Bootstrap和Subsampling是三种 典型的取样技术,在聚类集成中常被用于生成差异性较大 的数据集,在差异性较大的数据集上应用基聚类算法产生 多样性的聚类成员。CEGA没有考虑聚类成员的差异性, 只需考虑基聚类算法。为了更好地衡量四种算法的性能, 基聚类算法统一为标准K-means算法。图2给出了在相同 的硬件和软件环境下各算法在聚类成员生成阶段性能比 Computer Engineering and Applications计算机工程与应用 较的结果。横轴代表实验数据集,纵轴代表算法生成聚类 成员所花费的时间(单位:ms)。 数据集 图2 CEGA与常用采样技术存聚类 成员生成阶段的性能比较 由图2可以得出,三种取样技术在提高聚类成员的差 异性的同时也增加了算法的复杂度,CEGA可以明显提高 生成聚类成员的效率。 4.4 CEGA的进化 图3和图4分别是当最大和最小突变率均为0_3时, CEGA在Iris和Pima数据集上的进化情况。图5和图6分别 是当最大和最小突变率均为O.02时,CEGA在Iris和Pima 数据集上的进化情况。横轴代表进化代数,纵轴代表适应 度值。 0.848 0.846 | 0l844 842 0.840 』 i O.838 0 100 200 300 400 500 进化代数 图3 CEGA在Iris数据集卜进化最大 突变率和最小突变率均为0.3 /0 -  。0.526 一 ‘ , j型 0_524 , 0.522 , U lUU 200 j00 400 ,UU 进化代数 图4 CEGA在Pima数据集上进化最大 突变率和最小突变率均为0.3 从图3、4和图5、6中的种群进化速率对比情况可以得 出,在聚类问题中适当提高突变率可以使种群进化速率明 显提高,通过增加突变率达到了提高种群进化速率的目的。 0.743 0 趔 ol742 9 1l璺1 0.742 8 0 l00 200 300 400 500 进化代数 图5 CEGA存Iris数据集卜进化最大 突变率和最小突变率均为0.01 0.414 4 0.414 2 趔0.414 0 蜊0.413 6 - ・ 一 0 413 4 0.413 2  l0 100 200 300 400 500 进化代数 图6 CEGA在Pima数据粜【:进化最大 突变率和最小突变率均为0.01 5结束语 本文提出了基于遗传算法的聚类集成算法,无需考虑 聚类成员的差异性,着重体现遗传算法作为一致性函数在 集成中的全局寻优的功能,在遗传算法中增加了精英选择函 数,并适当提高突变率以增加进化速率。实验表明CEGA具 有较高的正确性和高效性。需要指出的是,算法在Magic04 数据集上取得了不错的聚类效果,但是其运行时问却相对 较长,这是由于算法将聚类成员作为染色体,当数据集中 数据量很大时,种群的染色体长度会相应地变长,进而利 用突变进行进化的效率会降低,从而导致进化时间增长。 实验中的对于大型的数据集可考虑将数据集划分为相互 重叠的数据子集,对数据子集分别进行聚类集成,利用重 叠信息进行整合,这是以后需要做的工作。 参考文献: [1]Topchy A,Jain A K,Punch W.Clustering ensembles:models of consensus and weak partition[J].IEEE Transactions on Pattern Analysis and Machine Intelligence.2005,27(12): 1866—1881. [2]王红军,李志蜀.基于隐含变量的聚类集成模型[J]l软件学报, 2009,20(4):825.833. [3]Zhou Zhihua,Tang Wei.Clusterer ensemble[J].Knowledge—Based Systems,2006,19(1):77—83. [4]Hansen L K,Salamon P.Neural network ensembles[J].IEEE Transactions on Pattern Analysis and Machine Intelligence, 1990,l2(10):993—1O01. (下转265页) 梁军,肖 琳,张立洋,等:REST风格人力资源类互联网应用系统设计与优化 Media,2007. 2013,49(8) 265 6结束语 随着信息技术的不断发展,人力资源类互联网应用系 [6]毛力锐,蔡鸿明,徐博艺,等.基于REST面向资源的企业集成 平台框架[J]_计算机工程,2010,36(2):254.256. [7]Mazzetti P,Nativi S,Caron J.RESTful implementation of geo— spatial services for earth and space science applications[J]. International Journal of Digital EaCh,2009,2(1):40—61. 统的技术也在不断进步。本文提出了基于REST架构风格 的人力资源类互联网应用系统的设计方法及基于缓存服 务器的缓存优化方案,为构建高效、松耦合、易扩展的REST 风格人力资源互联网应用系统提供了可行性方案。接下 来还可以在缓存算法和缓存替换算法方面进行深入研究。 [8]毛峰,刘婷,刘义仁,等.基于REST面向资源的地理信息服务 设计[J].计算机工程,2011,37(8):238.240. [9]陈赞,胡坚,汪超亮,等.基于REST Web Services的分布式遥 感数据检索技术研究[J]l计算机工程与设计,2010,31(14): 3207—3209. 参考文献: 【1】刘佳音.我国人力资源信息网站的现状与发展【J].情报科学, 2004,22(6):728—733. [10]程冬梅,王瑞聪,刘燕,等l基于REST架构风格的物联网服务 平台研发[J].计算机工程与应用,2012,48(14):74—78. [11]张歆爽.一种物联网资源共享平台的数据建模与实现[D】.北 京:北京邮电大学,2012. [12]黄锦川.REST风格服务在Android平台上的研究与应用[D】. 成都:西南交通大学,2010. [2]许卓明,栗明,董逸生.基于RPC和基于REST的web服务交互 模型比较分析[J].计算机工程,2003,29(20):6-8. [3]王建斌,胡小生,李康君,等.REST风格和基于SOAP的Web— Services的比较与结合[J].计算机应用于软件,2010,27(9): 297—300. 【4]Fielding R T.Architectural styles and the design of network— based software architectures[D].I ̄ine,California:University of California,2000. [13]基于REST架构风格的Web 2.0实现[J].计算机系统应用, 2009,18(7).165—168. [14】黄宁海.基于REST的轻量级J2EE架构实现【D].杭州:浙江大 学,2008. [5]Richardson L,Ruby S.RESTful web services[M].is.1.]:O’Reilly (上接168页) [5]Tumer K,Ghosh J.Error correlation and error reduction in [11]Holland J H.Adaptation in natural and artiifcial system[D]. Ann Arbor:The Universiy of Mitchigan Press,1975. ensemble classiifers[J].Connection Science,1996,8(3):385—403. [6]Breiman L.Bagging predicators[J].Machine Learning,1996,24 (2):123—140. [12]唐伟,周志华.基于Bagging的选择性聚类集成[J】.软件学报, 2005,16(4):496—502. [I3】恽为民,席裕庚.遗传算法的全局收敛性和计算效率分析[J]. 控制理论与应用,1996,13(4):455.460. 【14]Srinivas M,Patuaik L M.Adaptive probabilities of crossover and mutation in genetic algorithms[J].IEEE Transactions on Systems,Man fand Cybernetics,1994,24(4):656・667. [7]罗会兰.聚类集成关键技术研究[D].浙江:浙江大学,2007. [8]Wang Hongjun,Qi Jianhuai.Semi—supervised cluster ensemble based on binary similarity matrix[C]//The 2nd IEEE ICME. Chengdu:[s.n.],2010,4:251—254. 【9】He J,Tan A,Tan C.Modiied ART 2:a growifng network capable of generating a fixed number of nodes[J].IEEE Transactions on Neural Networks,2004,15(3):728.737. [10】Buekland M.AI techniques for game programming[M].Cin— cinnati:Premier Press。2002:89.117. [15]欧阳森,王建华.一种新的改进遗传算法[J].计算机工程与应 用,2003,39(11):13-15. [16]王红军,李志蜀.基于贝叶斯网络的半监督聚类集成模型[J]. 软件学报,2010,21(11):2814.2825. (上接230页) [4]吴国平.数字图像处理原理[M].武汉:中国地质大学出版社, 2007. 通过进化方法自动调节阈值以达最优。同时,去噪过程中 对采样图像的多次扫描也影响了其处理速度,其算法有待 优化。对于最终提取的光条中心曲线,尚需添加样条插 值、曲线拟合等技术以消除局部非连续与曲线平滑性不够 等不足,其处理步骤尚需改善。另外,求差分割对测量场 [5]周明全,耿国华,韦娜.基于内容的图像检索[M].北京:清华大 学出版社,2002. 【6]徐要刚.热态大锻件尺度的在线测量技术研究[D].上海:上海 交通大学,2009. [7]王志凌基于双CCD的大锻件尺寸测量的实验研究[D].秦皇岛: 燕山大学,2006. [8]Zhang Limei,Qiao Lishan,Chen Songcan.Graph—optimized lo- 景的特殊要求也决定该算法在应用上具有较大的局限性, 这均为今后相关研究需要改善之处。 参考文献: [1]王鹏.线结构光三维自动扫描系统关键技术的研究[D].天津: 天津大学,2008. cality preserving projections[J].Pattern Recognition,20 1 0,43 (6):1993—2002. [9徐要刚.9]激光测距法测量大锻件尺寸[J].机械设计与研究,2008, 24(6):94—97. [2]曹建农.图像分割方法研究[M].西安:西安地图出版社,2006. [3]吴庆阳.线结构光三维传感中关键技术研究【D].成都:四川大 学,2006. [1O]贺俊吉,张广军.结构光三维视觉检测中光条图像处理方法 研究[J]l北京航空航天大学学报,2003,29(7):593.597. 

因篇幅问题不能全部显示,请点此查看更多更全内容