您的当前位置:首页正文

数码相机的自动聚焦方法的研究与实现

2021-12-15 来源:好走旅游网
¨儿198{目『1*:—羔——.!L**々—一mmR日—j些!!镕&:——.专J/杰部孪≠碧硕士学位论文论文题目:数码相机的自动聚焦方法的研究与实现学生姓名学号冯荃硕050601朱秀昌教授/博导指导教师学科专j批研究方向论文提交月期堕兰兰堕星竺些图像处王!【!与多媒体通信南京邮电大学硕士研究生学位论文摘要摘要随着科技的飞速发展,数码相机使用越来越广泛。数码相机中的关键技术之一自动聚焦技术越来越受到人们的普遍关注。该技术性能的好坏会直接影响输出图像的质量。论文首先介绍了数码相机的成像原理和自动聚焦原理,并对现有的四类清晰度评价函数进行了举例分析。按照感兴趣的物体的物距不同,对自动聚焦进行了划分,分为两种情况:一种是长物距,即不同物体的物距均远大于焦距的情况;另一种是长短物距,即不同物体的物距不是全都远大于焦距的情况。论文研究了清晰度评价函数的性质,且对这两种情况下自动聚焦时清晰度评价函数的峰值特性做了重点研究。接着论文针对长短物距下的清晰度评价函数的特性,分别从边缘检测和高频分量含量的角度出发,提出了基于Sobel算子的清晰度评价函数和基于中心分块加权DCT的清晰度评价函数这两种方法。将这两种方法在长物距下和长短物距下与其它算法进行了比较,并对其聚焦性能进行了分析讨论。另外,论文还对这两种方法相互比较,说明了各自的优缺点。最后,论文还对所提的自动聚焦算法进行了验证,设计了自动聚焦实验平台。该实验平台能够按照RS.232C串口通信协议以及SONY公司的VISCA摄像机控制协议,根据论文所提的自动聚焦算法,通过Blackfin533的UART口对SONYEVI.D100摄像机进行聚焦控制。关键词:数码相机自动聚焦清晰度评价函数BF533南京邮电大学硕士研究生学位论文摘要AbstractWiththedevelopmentoneoftechnology,digitalstillcamerahasbeenusedwidely.theAuto—Focusing(AF)isofthemostimportantfunctionsofthedigitalstillcamera,sincequalityofthephotographisdirectlydeterminedbytheperformanceoftheAFsystem.Inthispaper,theimagingtheoryisintroduced.Thentheanalyzed.ThereintroducedaremechanismontheAFisalsoarefourclassesintraditionalimageclarityevaluationfunctions,whichalsointhepaper.Accordingtothedistinctnessoftheareobjectdistancesofinterestingobjects,theretwosituationsinautofocusing:oneisthatobjectdistancesofalltheobjectsarefarlongerthanthefocallengthofthelens,whichwecallotheristhatnotallthedifferentwhichwecalllong-object-distancethansituation;theobjectdistancesarefarlongerthefocallengthofthelens,long-short—object-distancearesituation.ThepropertiesoftheimageclarityevaluationfunctionunderthetwosituationsBasedonanalyzed,especiallyaboutpeakproperty.thepropertyunderthelong—short—object-distancesituation,twomethodshavebeenproposedinthepaper.Accordingtoedgedetecting,onemethodistheimageclarityevaluationfunctionbasedontheSobeloperator.Anothermethod,accordingtohighfrequencyinformationofimage,istheimageclarityCosineevaluationfimctionbasedoncenterweightedblockwithotherDCT(DiscreteTransform/DCT)method.Theintheirfocustwomethodsarecomparedalgorithms,andanalyzedperformances.Alsointhepaper,thetwomethodsarecomparedwimeachother,andillustratedabouttheiradvantagesanddisadvantages.Finally,anauto—focusingexperimentplatformbasedontheBlackfin533DSPisalsodesignedtoprovetheRS一232Cserialperformanceoftheproposedmethodinthispaper.AccordingtotheprotocolandSONYVISCAcontrolprotocol,bytheUARTinterfaceintheBlackfin533.theBlackfin533Cancontrolthecamera.KeyWords:Digitalstillcamera,Autofocusing,Clarityevaluationfunction,BF533.II.南京邮电大学学位论文独创性声明本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得南京邮电大学或其它教育机构的学位或证书而使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。研究生签名:>己座日期:南京邮电大学学位论文使用授权声明南京邮电大学、中国科学技术信息研究所、国家图书馆有权保留本人所送交学位论文的复印件和电子文档,可以采用影印、缩印或其他复制手段保存论文。本人电子文档的内容和纸质论文的内容相一致。除在保密期内的保密论文外,允许论文被查阅和借阅,可以公布(包括刊登)论文的全部或部分内容。论文的公布(包括刊登)授权南京邮电大学研究生部办理。研究生签名:l五座导师签名:咋龟温日翥:南京邮电大学硕上研究生学位论文第一章绪论第一章绪论随着现代科技的进步,数码相机这种数字成像设备逐渐进入了人们的生活,人们对数码相机的功能要求也越来越高。数码相机的自动聚焦功能是数码相机最重要的功能之一,因为拍摄图像的质量直接依赖于聚焦系统的性能。因此,如何正确聚焦被摄图像这一问题受到了人们的普遍关注。而数字图像处理技术这几年飞跃发展,将其运用到数码相机的自动聚焦问题上能够得到比较好的效果。1.1数码相机所谓数码相机(DigitalStillCamera),是一种能够进行拍摄,并通过内部处理把拍摄到的景物转换成以数字格式存放的图像的特殊照相机。与普通相机不同,数码相机并不使用胶片,而是使用固定的或者是可拆卸的半导体存储器来保存获取的图像。数码相机可以直接连接到计算机、电视机或者打印机上。在一定条件下,数码相机还可以直接接到移动式电话机或者手持PC机上。由于图像是内部处理的,所以使用者可以马上检查图像是否正确,而且可以立刻打印出来或是通过电子邮件传送出去。数码相机是由镜头、CCD(电荷耦合器件)、A/D(模/数转换器)、MPU(微处理器)、内置存储器、LCD(液晶显示器)、PC卡(可移动存储器)和接口(计算机接口、电视机接口)等部分组成,通常它们都安装在数码相机的内部【ll。数码相机的基本原理是利用普通照相机的光学系统,把被摄图像投影到图像传感器上,传感器把光信号转换成电信号,再经过A/D转换、数字图像处理和压缩,最终以数字信号方式存储到存储器、存储卡、磁盘等数字存储介质中。一般使用数码相机中固化的程序按照指定的文件格式,将图像以二进制数据流的形式存入存储介质中。数码相机与普通相机的一个最主要的区别在于数码相机中有一个软件模块——图像处理软件。通过该软件对图像处理,能够大大提高图像的输出质量。可以说,如果没有图像处理软件就没有数码相机系统,图像处理软件是数码相机中的关键技术。1.2数码相机自动聚焦方法1.2.1聚焦方式分类数码相机的自动聚焦(AF,AutoFocusing)阁大体上分为两种:主动方式(ActiveAF)和被动方式(PassiveAF)。南京邮电大学硕士研究生学位论文第一章绪论主动方式是应用近红外光线作为照射源,由红外发光二极管通过透镜发射红外光束(单束或多束)对被摄物体进行扫描辐射,反射回来后由光电元件接收,并转变为电信号,控制镜头的聚焦移动。红外光束由近至远进行扫描,当光电元件接收到的反射光束达到峰值时,电路系统输出的电信号将控制镜头停止移动,并停在正确的聚焦位置上。这种方式的特点在于可以在任何光照强度下工作,被照物体的明暗对聚焦性能不会有太大影响。但这种方式需要额外发射红外线的设备,会增加数码相机的重量。现在大部分数码相机均是便携式的,因此,一般数码相机不采用主动方式进行自动聚焦。被动方式是从相机透镜自身的光学成像中,利用计算机图像处理技术提取高频分量来调整焦点的方法。由于数码相机中的照片是以数字信号的方式存储于存储介质中,可以很方便地利用数码相机中的处理芯片处理这些数字信号,提取出自动聚焦所需的图像信息,所以采用被动式聚焦不需要额外的发射装置,能够充分利用数码相机的资源,降低了数码相机的复杂性和费用。因而,当前的数码相机一般采用被动式自动聚焦。因为被动方式是一种常用的自动聚焦方式,所以本文实验中所使用的数码相机和摄像机均采用被动方式进行自动聚焦的。而本文所提的聚焦方法也均是基于被动方式提出的。1.2.2自动聚焦原理一幅图像是否聚焦从视觉上可以通过其清晰程度来判断。通常称最清晰的图像为聚焦图像,而其它的图像为离焦图像。但是,对于计算机而言,要判断图像是否聚焦,显然不能通过视觉进行判断。对于采用被动方式进行自动聚焦的数码相机而言,可以采用图像处理技术,计算清晰度评价函数值来进行自动聚焦。当清晰度评价函数为最大值时就可以认为图像已经聚焦了。数码相机的自动聚焦过程为:相机的镜头向清晰度评价函数值增大的方向移动,直至移动到清晰度评价函数值最大的位置为止,而该位置就是图像的聚焦位置。数码相机的自动聚焦框刚3】如图1.1所示。自动聚焦系统通过对CCD输出的存于存储介质中的视频数字信号进行分析,即对图像进行分析,算出清晰度评价函数值。根据清晰度评价函数值产生步进电机的控制信号来控制步进电机的移动,通过步进电机的移动去控制相机镜头的前进或后退,直到正确聚焦。南京邮电大学硕士研究生学位论文第一章绪论每净步进电机一一CCD——+A/D转换———+沥”“L一√清晰度评价函数区域2痔讲由加.粹制信导1r,rl镜头位置信息搜索算法图1.1数码相机的自动聚焦框图1.3高速DSPDSP(DigitalSignalProcessor)是一种独特的微处理器,是处理大量数字信号的器件。其工作原理是对数字信号进行修改、删除、强化,并在其他系统芯片中把数据转换成模拟数据或是与实际环境相符合的格式。它不仅具有可编程性,而且其实时运行速度可达每秒数千万条复杂指令程序,远远超过了通用微处理器,是数字化电子世界中日益重要的芯片。它具有强大数据处理能力和高速的运行速度,这是它最大的特点。DSP是以数字信号处理为基础,因此具有以下几个特点【4】:.(1)接口方便。DSP系统与其它以现代数字技术为基础的系统或设备都是相互兼容的,用这样的系统接口实现某些功能要比采用模拟系统的接口来实现要容易得多。(2)编程方便。DSP系统中的可编程DSP芯片可使设计人员在开发过程中灵活方便地对软件进行修改和升级。(3)稳定性好。DSP系统以数字信号处理为基础,受环境温度以及噪声的影响较小,可靠性高。(4)可重复性好。模拟系统的性能受元器件参数性能变化比较大,而数字系统基本上不受影响,因此数字系统便于测试,调试和大规模生产。(5)集成方便。DSP系统中的数字部件有高度的规范性,便于大规模集成。在本文工作中,主要使用的是Blackfin533(简称:BF533)DSP。BlackfinDSP是ADI与Intel联合开发的体现高性能体系结构的首款第四代DSP产品。这一代产品是专为通信应用而设计的通用DSP芯片,能处理大量图像、声音、文本和数据流。关于Blackfin533的具体结构和特点将在第五章5.2.1节中进行介绍。南京邮电大学硕士研究生学位论文第一章绪论1.4论文主要研究工作、创新点和论文结构安排论文的主要工作是对数码相机的自动聚焦方法进行研究与实现。在进行自动聚焦的时候,一般会存在多个物体,有感兴趣的目标,也有其它目标和背景。根据这些物体物距的不同,本论文将自动聚焦分为两种情况:一种是长物距,即不同物体的物距均远大于焦距的情况;另一种是不同物体的物距不是全都远大于焦距的情况,可称之为长短物距。目前大部分对于自动聚焦的研究都是基于长物距情况下的自动聚焦,而对于长短物距下的自动聚焦问题则涉及很少。所以,论文主要是针对长短物距情况下的自动聚焦算法进行了研究。在研究长短物距情况下的自动聚焦时,论文根据清晰度评价函数应该满足的特性要求,提出了两种不同的清晰度评价函数。一种是基于Sobel算子的清晰度评价函数。论文将其与Roberts算子、LaplacianofGaussian算子进行了比较,发现该算子在长短物距情况下作为清晰度评价函数更加合适。另一种是基于中心分块加权DCT的清晰度评价函数。该方法通过采用中心分块的方法突出了中心区域的图像的重要性,并且考虑了局部高频分量的变化。它又通过加权函数来赋予每个分块不同的权重,从而突出目标的高频分量变化幅度,有效避免误判。论文将该算法和传统高频分量方法进行了比较。除此之外,为了更好的说明这两种方法的优劣性,论文还对所提的两种方法进行了比较。经研究发现在聚焦正确性方面,基于中心分块加权DCT的清晰度评价函数要优于基于Sobel算子的清晰度评价函数,但是基于Sobel算子的清晰度评价函数的复杂度和计算量要明显小于基于中心分块加权DCT的清晰度评价函数。论文还对所提的自动聚焦算法进行了验证,设计了自动聚焦实验平台。按照RS.232C串口通信协议以及SONYVISCA控制协议,通过BF533的UART口对SONY摄像机进行了聚焦控制,实现自动聚焦功能。论文结构安排如下:第一章:主要介绍了数码相机及其两种聚焦方式。由于论文还用到了DSP,所以还对高速DSP的特点进行了简单介绍。第二章:主要介绍了数码相机的成像原理及自动聚焦原理,并且对现有的四类清晰度评价函数进行了介绍。接着根据感兴趣的物体的物距大小,将自动聚焦的情况分为:长物距下的自动聚焦情况和长短物距下的自动聚焦情况,并且分析了这两种情况下清晰度评价函数的性质。第三章:从对图像进行边缘检测的角度出发,指出在长短物距情况下,基于Sobel算EVI—D100南京邮电大学硕士研究生学位论文第一章绪论子的清晰度评价函数的性能要比基于Roberts算子和LaplacianofGaussian算子的清晰度评价函数的性能好。在章节最后,还讨论了阈值对基于Sobel算子的清晰度评价函数的性能的影响。第四章:从分析图像高频含量的角度出发,提出了一种基于中心分块加权DCT的清晰度评价函数。论文分析了该算法的特点,对分块大小进行讨论和确定,并与传统的高频分量方法进行比较。在章节最后,还从四个方面,将第三章采用的基于SobeI算子的清晰度评价函数与该算法的性能进行了比较。第五章;论文对所提的自动聚焦算法进行了验证,设计了自动聚焦实验平台。实验平台包括软件部分和硬件部分的实现。整个实验平台完成的功能是通过BF533对SONYEVI.D100摄像机进行自动聚焦的控制。南京邮电大学硕士研究生学位论文第二章数码相机的成像原理及自动聚焦原理第二章数码相机的成像原理及自动聚焦原理数码相机的成像原理和普通相机的成像原理一样。其光学成像系统也是按照几何光学原理设计的,利用光的直线传播性质和光的折射与反射规律,把某一瞬间的被摄景物影像准确地聚焦在像平面上。可见,输出图像的质量完全取决于光学系统的传递特性。而数码相机之所以能进行自动聚焦,主要是通过数码相机中的图像处理软件实现的,通过它来计算所拍摄图像的清晰度评价函数值,根据该值的大小调整相机镜头的移动。2.1光学成像系统的点扩散函数根据光学原理可知,当光学系统满足线性及时空不变性的成像条件时,可以建立输入图像分布函数g(x,Y)和输出图像分布函数办(孝,f)之间的函数关系式,如式(2—1)所示【5】。二二办(孝,f)=lIg(x,y)p(孝--X,f-y)dxdy=g(f,f)拳p(孝,f)二二其中p(善,f)是光学成像系统的点扩散函数(PSF,PointSpread(2—1)Function)。由上式可知,光学成像系统的输出图像分布函数忍(善,f)可以完全由它的输入图像分布函数g(x,y)与点扩散函数P(4,f)卷积来确定。因此,对于一个线性时空不变性的光学成像系统。利用点扩散函数就可以在时域上完全定量的描述其成像特性;而若想在频域上定量表示则可以采用光学传递函数。光学传递函数与点扩散函数是一对傅立叶变换【6】。数码相机的成像系统和普通相机的成像系统一样。通常物体可以看作是呈二维分布的许多点光源。这样物体通过镜头系统的成像是分布在空间的多个光斑的叠加。由傅立叶光学理论可知,一个镜头系统可以合理地近似为平移不变性的线性系统,从而就可以把通过镜头拍摄到的图像描述为物体与镜头的光学系统的PSF的卷积【6J。2.2数码相机的镜头成像原理分析图2—1是一个简单的光学镜头成像原理图。设物体距离透镜的物距为U,透镜的焦距为厂,如果当物距U大于焦距厂时,那么物体所发出的光线经过透镜折射后会产生物体的实像,设此时的像距为1,,则在物距“、像距v和焦距厂之间满足共轭成像关系,如式(2—2)所示。三:三I一1-4-一=一一fUv(2—2)~Z一£J南京邮电大学硕士研究生学位论文第二章数码相机的成像原理及自动聚焦原理物平面透镜像平面图2—1光学镜头成像原理图如果此时观察平面位于像距位置处,那么可以在观察平面上得到物体所成的清晰的聚焦图像,称为聚焦状态。如果观察平面偏离了这个位置,那么物体上的每一个点光源所发出的光线经过透镜折射后,在观察平面上将产生一个模糊圆【71,设其半径为ro,此时,图像将会变得模糊,如果偏离聚焦位置越远,那么模糊圆的半径也就越大,图像也就越模糊,称为离焦状态。假设数码相机是一个无损系统,且到达镜头的光能为一个单位,那么理想的数码相机成像系统的PSF为:,,p(孝,f)d孝df=1的p(孝,f)可以表示为‘8】‘(2—3)假设光源发出的光能量均匀的分布在该模糊圆内,且模糊圆外的光能量分布为0,则上式pcf,f,={亨≥数码相机点扩散函数‘9,101,如式(2-5)所示:二::;:妻荨(2—4,实际上,在离焦时,物体点在成像平面上形成的模糊圆并不具有均匀的亮度,而且数码相机的光学成像系统是一个很复杂的系统,在实际应用中,一般用二维高斯函数代替理想的‘础朋=专exp(一等)式中,.是扩散系数。‘经研究发现,.与模糊圆的半径吒有关【111,其关系如下式所示:厂=qc>0(2-5)(2—6)塑室塑皇奎兰堡主竺壅圭兰垡笙奎墨三垩塑里塑垫箜壁堡堕堡垄鱼垫鍪堡堕里c为一个常量,实际应用中一般取1/√乏。从(2—5)式可以看出,如果厂越小,镜头成像系统就越理想,所成的图像就越清晰;反之,如果,越大,则镜头成像系统就越不理想,所成的图像就越模糊。可见,可以通过设置,.的值来得到聚焦程度不同的离焦图像。2.3自动聚焦原理从(2.5)式可以看出,当离焦时,数码相机成像系统是一个二维的高斯低通滤波器【6,12】。离焦的图像可以认为是由于图像的高频成分经过低通滤波后受到了损失,因此图像变得模糊,离焦程度越大的图像,损失的高频成分也就越多。也就是,离焦的图像所含的高频分量要明显少于聚焦的图像所含的高频分量。因此,可以从频域角度出发,测量图像的高频分量含量,来确定图像是否聚焦。在聚焦过程所得到的一系列图像中,包含高频分量最多的图像就是聚焦图像,此时数码相机正确聚焦。如果一幅图像的频谱所包含的高频分量很多,说明图像中的边缘或者细节很丰富,而图像也很清晰。反之,若一幅图像的频谱所包含的高频分量较少,说明图像很模糊,就意味着在空域中图像的边缘或细节也就变得模糊。换而言之,如果从空域的角度出发,将图像的边缘信息作为聚焦的判据准则是可行的。当图像清晰时,图像的边缘或细节信息比较丰富;当图像模糊时,说明图像的边缘信息较少。2.4图像清晰度评价函数评价一幅图像是否为聚焦图像的方法有很多,通常称这些方法为图像清晰度评价函数【13】。在选择清晰度评价函数时,不仅该函数要满足自动聚焦原理,而且也必须满足一些特殊的性质,以方便控制电机的步进。假定在聚焦过程中得到的一系列图像为Z(x,y)(1≤k≤N),^伪图像序列中的图像数目,清晰度评价函数为州·】,则经过该函数可得:逆=FFf(石,y)](1≤k≤Ⅳ)(2—6)其中最为第k幅图像的清晰度评价函数值。≮的最大值所对应的图像就是聚焦图像。2.4.1清晰度评价函数的分类传统的图像清晰度评价函数主要可以分为以下四类【14】:(1)灰度变化函数聚焦图像比离焦图像包含更多的灰度变化,所以图像灰度值的变化可以作为评价函.R.南京邮电大学硕士研究生学位论文第二章数码相机的成像原理及自动聚焦原理数。(2)梯度函数在图像处理中,图像梯度可以用来进行边缘提取,离焦越小的图像边缘越陡峭,应该具有更大的图像梯度值。(3)图像灰度熵函数聚焦图像的信息熵要大于离焦图像的信息熵,因此图像的灰度熵也可以作为评价函数。(4)频域类函数这类函数主要基于傅里叶变换。傅里叶变换的高频分量对应着图像边缘,而聚焦图像总是具有陡峭的边缘,即包含着更多的高频分量,这样可以根据图像傅里叶变换后高频分量含量的多少作为评价函数。2.4.2评价函数举例根据上一节对图像清晰度评价函数的分类,这里给出不同分类的清晰度评价函数的典型例子。假定在聚焦过程中得到的一系列图像为Z(x,J,),大小均为MxN,k为图像的序列号,其取值范围为l≤k≤N,x和Y分别代表了图像的行和列,其中1≤X≤M,1≤Y≤N。1.灰度变化函数这里所说的灰度变化函数是指灰度方差函数。最典型的就是VAR算子【151,1i1]Variance(亮度变化)算子。VAR算子计算图像每个像素点灰度与图像平均灰度值之差的总和。第k幅图像的平均灰度为:万=上M-N羔...J喜他力使用VAR算子得到的图像序列的第k幅图像的清晰度评价函数值为:(2-8)VAR(七)=面1丢.善Nk(五J,)一万12则聚焦图像的清晰度评价函数值为:VA&=max{VAR(k)}此时vg&对应的图像就是聚焦图像。(2—9)(2—10)图像的灰度方差大小表示了图像像素点灰度分布的离散程度的大小。当图像完全模糊时,像素点的灰度值分布离散度较小,灰度方差较小;当图像清晰时,像素点灰度值分布南京邮电大学硕士研究生学位论文第二苹数码相机的成像原理及目动聚焦原理离散度大,灰度方差较大。灰度方差函数以图像窗口所有像素点的灰度平均值为参考,对每个像素点的灰度值求差后取平方和,然后再用像素点数标准化,它表征了计算区域内图像灰度变化的平均程度。所以灰度方差函数在一定程度上可以作为图像清晰度的评价函数。2.梯度函数梯度函数也是比较有效的一类清晰度评价函数。常用的梯度函数主要有Roberts算子、LaplacianofGaussian算子等。①Roberts算子Roberts算子米用的是对角方向相邻的两个像素之差。从图像处理的实际效果来看,它边缘定位准确,对噪声敏感【161。Roberts边缘检测算子是一种利用局部差分算子寻找边缘的算子,如式(2.11)和(2.12)所示。G[x,y】=I厂【x,yl-f[x+l,y+lll+lf[x+l,y卜j[x,y+qIG[x,y】=[(厂【x,y卜/【x+1,J,+1】)2+(厂【x+1,yl-f[x,y+1】)2]啦(2—11)(2—12)fix,Y】表示处理前(x,y)点的灰度,G[x,y】表示处理后该点的灰度。平方根运算使该处理类似于人类视觉系统中发生的过程。该算子的矩阵形式表达如下:[划[Ⅻ则对于图像序列中的第k幅图像,采用Roberts算子得到的清晰度评价函数值为:幽,(2—14)G(尼)=∑∑q[x,Y】那么,聚焦图像对应的图像清晰评价函数值为:G0=max{G(k)}(2—15)(2.15)式中得到的G(尼)值反映了图像序列中的第k幅图像的灰度变化率的大小。一幅图像越清楚,则灰度变化率越大。当图像由模糊变清楚时,图像的灰度变化率也相应的由小变大,G(后)的最大值G0所对应的图像就是聚焦图像。从Roberts梯度算法中可以看出,Robe,s梯度的两个模板分别是使用了正45度角方向的梯度和负45度角方向的梯度。但是实际的梯度方向可能在水平或者垂直方向上,所以Robe,s梯度存在一定的误差【171。②LaplacianofGaussians算子LaplaCiall算子㈣的定义为:v:厂:型+型(2—16)V2厂(x,y)≈厂(x,y)一j1。,、X,y+1)+/(z,Y一1)+厂(x+l,y)+厂(x一1,y)】(2—17)此,对数字图像厂(x,Y)的每个像素,L印lacian算子取它关于X轴方向和J,轴方向的两个差这是一个与边缘无关的边缘检测算子。若V2f(x,Y)在(x,Y)点发生零交叉,则(x,Y)为阶跃V2=[虽三虽]或[三i三三}]或[÷三÷]一2—4—4-4—28248O_48_4c2一19,o-4_408O(2-20)O_4_2_4_4—4—2则对于图像序列中的第k幅图像,采用LaplacianofGaussians算子得到的清晰度评价函数值为:G(尼)=∑∑V2Z(x,y).11.(2—21)童塞堕皇奎堂堡主竺壅竺兰垡堡茎聚焦图像对应的图像清晰度评价函数值为:墨三雯鍪里塑!!堕堕堡堕堡壑旦垫壅堡堡里Go=max{G(尼)}此时,Gn所对应的图像就是聚焦图像。(2—22)除上面所举的两个灰度梯度函数之外,有SMD(SumModulusDifference,灰度差分绝对值之和)算子和图像灰度梯度向量模方和算法【14】。一幅图像梯度反映了该图像的灰度变化率的大小【19'201。图像中的陡峭边缘的梯度值很大;灰度变化平缓的地方,梯度值较小;而那些灰度值相同的地方,梯度值为零。对于模糊图像来说,图像中边缘细节部分严重损失,图像的灰度变化不明显,梯度值相对较小;相反,当图像清晰时,图像中的边缘细节部分明显,灰度变化起伏变大,梯度值也相对较大。灰度梯度函数对图像中的每个像素点进行梯度运算,然后对所有像素点的梯度值求和,得到的就是整个图像的边缘变化剧烈情况。所以灰度梯度函数是一种有效的图像清晰度评价函数。3.图像灰度熵函数图像作为一个二维信源,不同的像素点取不同的灰度和颜色。假设图像灰度级为刀,像素的灰度用吼表示,则只表示吼灰度级出现的概率,且各像素和各灰度是统计独立的,而且不考虑像素点的几何位置。对于图像序列中的第k幅图像的Shannon熵(信息熵)为:日(后)=一∑只log(p,)则聚焦图像的清晰度评价函数值为:鼠=max{日(七)}只所对应的图像就是聚焦图像。(2-24)图像的灰度熵大小表示图像像素点灰度分布的离散程度的大小‘21’221。当计算区域内图像像素点的灰度值变化较大时,灰度熵也较大;当计算区域内图像像素点的灰度值相等时,灰度熵最小。当图像较清晰时,像素点灰度值分布离散程度较大,从而灰度熵较大;当图像完全模糊时,像素点的灰度值分布离散程度较小,灰度熵较小·。所以图像的灰度熵在一定程度上可以作为图像的清晰度评价函数。4.频域类函数从2.2节分析可知,数码相机的镜头相当于一个二维的低通滤波器。离焦的图像可以认为是图像经过镜头后高频分量受到了损失。离焦程度越大,则损失的高频分量越多,图像也就越模糊。因此,可以从这个角度出发,将高频分量作为图像的清晰度评价函数。离散傅立叶变换和离散余弦变换是最常用的两种变换函数。.1'.壹窒坚皇奎兰堡主堕窒竺堂垡丝奎①离散傅立叶变换至三垩塑里塑翌!堕壁堡垒墨丝旦垫墨堡堕堡在频域中,图像边缘体现为高频分量,通过二维离散傅立叶变换,可以提取频域中的高频能量作为判据。另外,对图像的自相关函数作傅立叶变换,所得到的功率谱也可以作为调焦的判据。图像的二维离散傅立叶变换如下:脚'v)=萋M-!善N-I巾咖p卜J‘(若+剥(2-25)傅立叶变换最大的问题就是运算量较大,但傅立叶变换的快速算法可以显著地提高运算速度。②离散余弦变换虽然离散傅里叶变换是数字图像处理中最重要的变换之一,但是它的参数都是复数,在数据的描述上相当于实数的两倍,在实际应用中,存在着很多不便。为此,希望有一种能够达到相同功能而又是易于操作的变换,从而考虑到二维DCT(DiscreteCosineTransform)。DCT具有能使图像的最重要的信息集中在较少的一些DCT系数上的性能‘231。正是基于此,DCT通常应用于图像处理。二维DCT可以从图像中提取高频分量,经过DCT变换后,DCT系数矩阵的左上部分为低频部分,右下部分为高频部分。DCT变换的定义如下:眇,=击以MV墨M-I善N-Im川cosbm删“]cos[焉m邶V]其中,_c“,={:}“:。,u2,=…O,肘一。,ccV,={:}v:。,v2,=...O,Ⅳ一。F(u,1,)为数字图像厂(x,y)的DCT系数。由于DCT变换是一种酉变换‘241。由酉变换的保持能量不变性有:E=∑∑f(x,y)2=∑∑F(u,V)2而图像的直流分量可以直接由下式得到:(2—27)瓦:艺艺死历2这样,对于图像序列中的第k幅图像的高频分量就可以表示为:(2—28)E。(七):∑M-I∑N-I【Z(x,y):卜Ⅳ:厕2:∑M-I∑N-I互@,力z其中,(“,v)≠(O,0)。则聚焦图像的清晰度评价函数值为:(2—29)南京邮电大学硕士研究生学位论文第二章数码相机的成像原理及自动聚焦原理E二maX{k(七)}此时,E对应的图像就为聚焦图像。(2-30)2.5不同物距下的图像清晰度评价函数应具有的特性为了更好的研究不同情况下的图像清晰度评价函数应具有的特性,首先根据被摄物体物距长短对自动聚焦的情况进行分类。在自动聚焦的时候,一般会存在多个物体,有感兴趣的目标,也有其它目标和背景。根据这些物体物距的不同可以将自动聚焦分为两种情况:一种是长物距,即不同物体的物距均远大于焦距的情况:另一种是不同物体的物距不是全都远大于焦距的情况,称之为长短物距【251。同理,图像清晰度评价函数应具有的特性也可以根据情况分为两大类,一类是长物距情况下的图像清晰度评价函数应具有的特性;另一类是长短物距情况下的图像清晰度评价函数应具有的特性。不论是长物距下的图像清晰度评价函数还是长短物距下的图像清晰度评价函数,均应满足一些共同的特性。图像清晰度评价函数具备两方面的条件,一个是聚焦的精度问题,即如何使得镜头能可靠的达到精确聚焦的位置;另一个是聚焦的速度问题,即如何使得镜头能快速有效的达到聚焦。因此,为了能满足这两方面条件,清晰度评价函数需要满足三个特性:1)无偏性好;2)灵敏性高;3)信噪比高【261。无偏性好是指,在一个图像序列中,图像清晰度评价函数的最大值对应的图像应是聚焦图像。如果图像清晰度评价函数的最大值对应的图像不是聚焦图像而是离焦图像,则会出现聚焦偏差。灵敏性好是指,图像清晰度评价函数对图像序列中的帧与帧之间的灰度变化敏感,能够充分利用有限的变化信息来进行正确聚焦。信噪比高是指,图像清晰度评价函数应具有抗噪声性能。此外,大部分论文还认为图像清晰度评价函数应具有单峰·|生[6,7,13,16-22,271。但是,论文认为不可一概而论,应根据具体情况讨论。为此,论文从长物距情况和长短物距情况分别对图像清晰度评价函数的峰值性进行讨论。2.5.1长物距情况下的图像清晰度评价函数的峰值特性长物距情况下的自动聚焦是指,被拍摄的物体的物距均远大于相机焦距的情况下的自动聚焦。图2.2是长物距情况下拍摄的一组图像。其中(a)为聚焦时的图像,(b)为离焦时的图像。南京邮电大学砸上研究生学位论文第=章数码相机的成像原理厦自动聚焦原目翠嘲嘲嚏鲢自■皇■■▲警(a)聚熊图像图2-2长物距情况的自动聚焦(b)离焦图像设物体距离透镜的物距为/,t,透镜的焦距为,,像距为v。根据光学原理可以知道,当物距“大于焦距,时,物体所发出的光线经过透镜折射后会产生物体的实像。这时将观察平面放置在像距处,则会得到一幅清晰的聚焦图像。如果观察平面偏离像距位置,则会在观察平面上出现模糊的图像。模糊的程度由偏离程度决定,偏离位置越大则越模糊。如果当物体的物距“远大于透镜的焦距f时,像距v可近似为:v:』,_。,“一f。(231)从式(2.31)中叫以看出,当不同物体的物距均远大丁焦距时,就可以认为这些物体发出的光为近似平行光。这样,经过透镜折射后,均会聚焦到焦平面上。只要此时观察平面位丁焦平面上,那么就可以在观察平面上得到这些物体同时聚焦时所成的清晰的聚焦图像。如果此时观察·F面偏离了这个位置,那么在观察平而上将得到这些物体的模糊的离焦图像㈣。从上而分析可以得到,在长物距情况下,移动观察屏r叮以同时得到所有拍摄物体同时聚焦的幽像或者同州离焦的酗像。也就是说,此时的斟像清晰度评价函数成满足单峰性。2.5.2长短物距情况下的图像清晰度评价函数的峰值特性长短物距情况F的自动聚焦是指,被拍摄f;}勺物体的物距不是全部远大于相机焦距的情况下的自动聚焦。为了更好的讨论长短物距下的清晰度评价函数的性质,长短物距情况又分成两种情况I“1:种为聚焦目标离背景很近时的长短物距情况,如图2-3所示:另一种为聚焦目标离背景很远时的长短物*E情况,如图2-4所不。在罔2-3和倒2-4中,(a)为目标聚焦而背景离焦时的图像,(b)为目标离焦而背景聚焦时的图像,(c)为目标和背景均离焦时的图像。塑杰苎皇查兰堡±旦塞竺兰些丝兰里三垩塑型塑墨塑些堡里里苎i墅矍些堡里(a)目标聚焦而背景离焦b)目标离焦而背景聚焦富誉图2-3聚焦目标离背景}H近时的长短物距情况(c)目标和背景均离焦謇一雪;。a)目标聚焦而背景离焦(b)目标离焦而背景聚焦图24聚焦目标离背景i日远时的K短物距睛况懑已强蠡音李一薹。警曼越(C)目标和背景均离焦在不同物体的物距不是全都远大于焦距的情况下,这些物体发出的光经过透镜折射后F能近似为平行光,也就意味着不可能同日』聚焦。如图2-5所示南京邮电大学硕士研究生学位论文第二章数码相机的成像原理及自动聚焦原理图2.5长短物距情况下的物体成像关系图图2.5中有两个物体M和N,它们具有不同的物距。两物体经过透镜折射后得到的像M’和N’。可以发现不论如何移动观察平面,都不可能得N-者同时聚焦的图像。在图2.5中,假设M是目标,N是背景。在进行自动聚焦时会获得两幅聚焦图像:一幅是对M进行聚焦,而N是离焦的;另一幅是对N进行聚焦,而M是离焦的。从上面分析可以得到,在长短物距情况下,移动观察屏不可能同时得到所有被摄物体同时聚焦的图像,只能通过移动观察平面,分别得到不同物体聚焦图像。此时的图像清晰度评价函数应满足多峰性,即聚焦目标离背景很近时的长短物距情况和聚焦目标离背景很远时的长短物距情况的清晰度评价函数均应满足多峰性,只是在峰值之间距离上有所不同。当聚焦目标离背景很近时,峰值之间的距离也较近;当聚焦目标离背景很远时,峰值之间的距离也较远。对于适用于长短物距下的清晰度评价函数,其最大峰值应该对应于对目标聚焦的图像。如果最大峰值不是对应于对目标聚焦的图像,则会出现偏差,使得最终的聚焦图像并不是所希望得到的目标图像。2.6本章小结在这一章中,假设数码相机的成像系统为平移不变的线性系统,则可以采用光学原理中的点扩散函数对其成像系统进行描述。通过研究点扩散函数,了解到数码相机在离焦时相当于一个二维高斯低通滤波器。当离焦程度越大时,损失的高频分量越多。在此基础上,进一步介绍了数码相机的自动聚焦原理。在通过图像处理技术进行数码相机的自动聚焦时,可以从图像包含高频分量的多少以及图像边缘细节的丰富程度这两个角度出发,来进行聚焦判断,从而得到准确的聚焦图像。论文介绍了目前用于进行聚焦判断的四类图像清晰度评价函数:灰度变化函数、梯度函数、图像灰度熵函数和频域类函数,并对这每一类的清晰度评价函数进行了举例介绍。论文还分析了不同物距下的图像清晰度评价函数应具有的特性。为了能够准确快速的南京邮电大学硕士研究生学位论文第二章数码相机的成像原理及自动聚焦原理进行自动聚焦,图像清晰度评价函数应满足:无偏性好、灵敏度高、信噪比高。另外。论文认为现今观点认为图像清晰度评价函数应满足单峰性,不是完全正确的,不能一概而论。为了更好的说明图像清晰度评价函数应满足的峰值性,论文提出应该根据被拍摄物体的物距不同,将聚焦情况分为两种:长物距情况和长短物距情况。文中对这两种情况下的自动聚焦进行了分别讨论,发现在长物距情况下,图像清晰度评价函数满足单峰性,而在长短物距情况下,图像清晰度评价函数则应满足多峰性。在下一章中,论文将重点研究在长短物距情况下的图像清晰度评价函数,提出一种新的聚焦算法。南京邮电大学硕上研究生学位论文第三章基于Sobel算子的清晰度评价函数第三章基于Sobel算子的清晰度评价函数一幅图像的梯度反映了该图像的灰度变化率的大小。对于模糊图像来说,图像中边缘细节部分严重损失,图像的灰度变化不明显,梯度值相对较小;相反,当图像清晰时,图像中的边缘细节部分明显,灰度变化起伏变大,梯度值也相对较大。因此,灰度梯度函数是一种有效而且简单的图像清晰度评价函数。目前,经常用于作为清晰度评价函数的灰度梯度函数有Roberts算子和LaplacianofGaussian算子等。许多论文都证明了,这两个算子在用于长物距情况下的自动聚焦时,会取得良好的效果[15,16,29,30,31,321。但是当用于长短物距情况下时,本论文发现效果并不是很好。因此,在此基础上,论文提出了基于Sobel算子的清晰度评价函数方法。在长短物距情况下,该函数的性能要E}IRoberts算子和LaplacianofGaussian算子好。论文将对这三个算子分别在长短物距下和长物距情况下的聚焦性能进行比较。3.1一种基于Sobei算子的清晰度评价函数根据第二章的分析可知,一种理想的清晰度评价函数应该满足无偏性好、灵敏性高、信噪比高这些特点。至于峰值性,需要根据自动聚焦的情况进行判断。当在长物距情况下自动聚焦时,不同物体的物距均远大于焦距,这些物体发出的光近似为平行光,经过透镜折射后全部聚焦到焦平面上,此时清晰度评价函数应满足单峰性。当在长短物距情况下自动聚焦时,不同物体的物距不是全都远大于焦距,发出的光经过透镜折射后,就不可能在观察平面上同时聚焦,此时清晰度评价函数应满足多峰性。换而言之,在长短物距情况下,通过移动观察平面会得到多幅聚焦图像,即清晰度评价函数会出现多峰的情况,每个峰值对应一个物体聚焦的图像。在这种情况下,研究发现,基于Sobel算子的清晰度评价函数要比基于Roberts算子以及LaplacianofGaussian算子的清晰度评价函数的性能要好。它的无偏性更好,灵敏度更高。关于Roberts算子、LaplacianofGaussian算子的计算方法已经在第二章的2.4.2节作了详细的介绍,这里不再赘述。而Sobel算子【171和Roberts算子、LaplacianofGaussian算子一样,也是一种在边缘检测中常用的算子。它有一定噪声抑制能力,在检测阶跃边缘时得到的边缘宽度至少为两个像素。它是不依赖于边缘方向的一阶微分算子,它不是向量,具有旋转不变即各向同性的性质【33】。Sobel算子由两个卷积核构成。对于灰度图像f(x,Y),图像中的每个点f(x,Y)都用这两个核做卷积,一个核对水平边缘影响最大,卷积后得到式.19.至三皇薹主!竺!竺!兰三箜塑堕垦堡竺里鍪堕壅塑皇奎兰堡主里壅竺堂垡堡奎(3.1),另一个核对垂直边缘影响最大,卷积后得到式(3.2),将二者平方相加后即是该点的输出值G[f(x,y)],如式(3-3)所示。△q=f(x+l,y-1)+2f(x+l,少)+厂(x+l,y+1)一f(x一1,y一1)(2-1、、v-2f(x-1,y)一f(x一1,y+1)△g2/(x一1,y+1)+2f(x,y+1)+厂(x+1,Y+1)一厂@-1,Y-1)-2f(x,y-1)-f(x+l,Y一1)(3—2)G№朋=∽筘搿三糍节中详细讨论。采用基于Sobel算子的清晰度评价函数公式为:睁3,其中thresh是阈值,即当l△qis+l△G,12>thresh时,求得的Sobel算子值为1,而当I△q12+l△G,12<thresh时,求得的Sobel算子值为0。关于设置阈值的意义论文将在3.3G(尼)=∑∑G∽(x,y)】Go=max{G(k)}(3—4)(3—5)式中G(k)反映了第k幅图像灰度变化率的大小。图像由模糊变清晰时G(k)的值由小变大,也就意味着图像的边缘信息越来越丰富。当G(k)最大时所对应的图像就是聚焦图像。3.2仿真流程及结果分析本论文所基于的仿真环境为:操作系统为WindowsXP,CPU为IntelPentiumMprocessor1.70GHz,内存为512Mb的PC机,佳能EOS350D数码相机。在进行仿真之前,论文将采集到的图像进行一些预处理。3.2.1颜色转换处理及中心窗口方法数码相机所拍摄的图像一般是真彩色图像。在图像处理技术中,一个像素的颜色是由它在某个颜色空间中的位置来描述的,常用的颜色空间有灰度Gray、RGB、亮度、色度(YCbCr或Ytm)等t12】。在仿真过程中,数码相机所拍摄的彩色图像(大小为2496×1664)以JPEG的格式存储于计算机中。存储于计算机中的JPEG图像的每个像素都可以用R、G、B三个分量表示。自然界中的所有颜色都可以由红绿蓝(R、G、B)3种原色组合而成。为了更好的表示红、绿、蓝所含成分的多少,人为的将其分成0到255个共256个等级。0级表示不含某种原色成分,255级表示含有100%的某种原色成分。这样,根据红、绿、蓝各种不同的组合就能表示出堕室塑皇奎兰堡圭堡窒圭兰垡丝塞釜三童茎王簦王堕塑堕星堡竺里墼256×256×256(约1600万)种颜色。这种图像称为真彩色图像。当一幅图像中每个像素被赋予不同的RGB值时,就能呈现出五彩缤纷的颜色。在数码相机自动聚焦算法的仿真中,如果直接采用真彩色图像,处理量比较大,计算复杂度也会升高。例如,如果图像的每个像素都用R、G、B三个分量表示,一个像素需要用3个字节(每个分量有256个级别,需用8位,即一个字节表示,则3个分量需要用3个字节表示)。假设一幅大小为2496×1664的图像,它共有4153344个像素,这样保存整个图像要用2496×1664×3,即12460032个字节。可见其占用了比较大的存储空间,而对这么大一幅图像进行读取会占用较多的时间。如果采用灰度图像,则在计算量方面就会小很多。因为灰度图像是指只含亮度信息,不含色彩信息的图像,就像我们平时看到的亮度由暗到明的黑白照片。要表示灰度图像,就需要把亮度值进行量化,通常划分为O到255共256个级别,O表示最暗(全黑),255表示最亮(全自)。可见将真彩色图像转化为灰度图像是很有必要的。灰度图像和彩色图像的转换公式可以采用下式:Gray=吾(R+G+召)色图像就转换为灰度图像。(3—6)存储每一幅图像在进行自动聚焦算法之前,均采用(3—6)式进行预处理,这样得到的真彩实验后,可以发现即使采用(3—6)式后,计算量依然很大。对于大小为2496X1664的真彩色图像,采用该式后,大小不变,只是在存储时每个像素只需要一个字节。这样,每幅图像所占的空间大小为4153344个字节。如果采用基于Sobel算子的自动聚焦算法,则就需要对4153344个像素进行模板对应相乘,共需要进行4153344次乘法运算,这个运算量依然很大,会影响聚焦的速度。考虑到,一般使用数码相机拍摄时,通常将聚焦的目标放置在取景框的中央,它实际上只占据中间的一部分而已。因此,需对这一部分的图像进行聚焦即可【341。基于这种情况,论文采用了中心窗口的方法,即将该窗口内的图像对应的聚焦平面作为整个图像的聚焦平面。此时,窗口大小的选取显得尤为重要。若窗口过大,虽然包含了较多的目标物体的信息,但同时也会包含过多的背景信息,导致在利用清晰度评价函数来分析最终聚焦图像时做出误判。若窗口过小,则会丢失目标物体的一些边缘信息,同样也会造成在利用清晰度评价函数来分析最终聚焦图像时做出误判。因此,需要折中考虑窗口的大小。具体地说,将二维原始图像的行和列分别进行三等分,然后分别取行和列的中间部分相交的区域作为感兴趣的中心窗口,于是窗口的面积占整幅图像面积的1/9,可以看出这时窗口的大小可以随着图像的分辨率做自适应地调整。在拍摄图像时,可将感兴趣的目标锁定在中心窗口,这样就可以利用后续的图像清晰度评价函数仅对感兴趣南京邮电大学硕士研究生学位论文第三章基于Sobel算子的清晰度评价函数的目标进行自动聚焦。3.2.2仿真流程论文采用了三组测试图像序列,分别为“Computer"图像序列、“Clock”图像序列、“Mickey’’图像序列,图像大小均为2496×1664。“Computer’’图像序列是在长物距情况下拍摄的,共有16帧图像,其中对目标聚焦的图像为第5帧。为了更好的讨论长短物距下的自动聚焦过程,论文将长短物距情况又分成两种情况:一种为聚焦目标离背景很近时的长短物距情况,拍摄的序列为“Clock”图像序列,该序列共34帧图像,其中对目标聚焦的图像为第20帧;另一种为聚焦目标离背景很远时的长短物距情况,拍摄的序列为“Mickey”图像序列,该序列共44帧图像,其中对目标聚焦的图像为第27帧。实验中,论文主要应用Matlab7.14软件对这三组测试图像进行了仿真实验。为了更好说明Sobel算子的聚焦性能的优越性,论文将其与Roberts,LaplacianofGaussian算子进行了比较。在比较时,三种微分算子均采用了阈值。具体的实验步骤如下:(1)在三种不同聚焦条件下,通过手动微调数码相机的焦距,得到由模糊到清楚,再由清楚到模糊的三组测试图像。(2)采集到的图像为真彩色图像。为了方便计算,将其转换为灰度图像。考虑到通常将聚焦目标放置在取景框中间,采用中心窗口方法,取整个图像的中间1/9大小的区域作为感兴趣的区域,其它部分不予考虑。(3)对这三组测试序列的感兴趣的区域分别进行Sobel,Roberts和LaplacianGaussian三种算子的微分运算,得到每帧图像的清晰度评价函数值。of(4)分别画出三种微分算子的归一化的图像清晰度评价函数曲线图,进行比较和分析。这里归一化的清晰度评价函数曲线中的“归一化"的含义是指,假设有m帧图像,第k帧图像的清晰度评价函数值为G(忌),m帧图像中的清晰度评价函数值的最大值为G0。则第k帧图像的归一化清晰度评价函数值为GCk)/Q。在实验步骤的基础上,可以得到仿真的流程图,如图3.1所示。图像卜_叫灰度变换取出中心窗口中的图像微分计算清晰度评价函数值归一化图3.1仿真流程图3.2.3结果分析宣室坚皇奎堂堡主婴窒竺兰垡笙茎笙三兰苎三12111簦王塑塑堕垦堡竺里鍪实验分别对“Computer”图像序列、“Clock”图像序列和“Mickey"图像序列进行了仿真实验。在实验中,对这三组图像分别采用了Sobel、Roberts和Laplacian算子,得到了不同的结果。“Computer"图像序列的结果如图3—2所示。-Compute悃像序列的图像清晰度评价函数盥线ofGaussian图3-2“Computer”图像序列的图像清晰度评价函数曲线从图3.2中可以看出,在长物距情况下,图像清晰度评价函数曲线均比较平滑,且峰值对应的图像均是聚焦图像,因此,采用这三种微分算子都能够准确的进行自动聚焦。只是采用Sobel算子和Roberts算子得到的清晰度评价函数曲线在峰值位置的锋利性更明显,说明这两个算子对图像清晰度的变化比较敏感。图3.3是三个算子作用到“Clock”图像序列所得到的图像清晰度评价函数曲线。。Clock惆像序列的图像清晰度评价函数曲线1090807060504≠幸‘厂7尹。—一掰’磁¨·‘髓··,,I——◆一SobeI—_}Roberts——+一LaDlacianofOaussianf;,j《j八r’f专步j、匾等拳趟葺瞎030201jil}}l|、≯—∥}k\、0萎K图3.3“Clock”图像序列的图像清晰度评价函数曲线可以看出,在长短物距情况下,且目标与背景很近时,采用Sobel和Roberts算子时,图像清晰度评价函数曲线出现了明显的双峰现象,且对目标聚焦的图像的清晰度评价函数值最大。采用Sobel算子时,得到的对目标聚焦图像为第20帧,对背景聚焦图像为第17—23·南京邮电大学硕士研究生学位论文第三章基于Sobel算子的清晰度评价函数帧,这符合拍摄的图像序列性质,且整个曲线在双峰的两侧均呈现比较完美的单调特性,在峰值两侧的清晰度评价函数值的变化也比较明显。采用Roberts算子时,得到的对目标聚焦图像为第20帧,对背景聚焦图像为第16帧,且在对背景聚焦的峰值位置左右不满足单调性,出现了毛刺。这说明在此情况下,Roberts算子的性能没有Sobel算子的性能好。而采用LaplacianofGaussian算子时,虽然图像清晰度评价函数曲线也出现了双峰现象,但是,最大峰值所对应的图像不是聚焦图像,而是离焦图像,出现偏差。因此,该算子在此情况下并不适用。图3-4是三个算子作用到“Mickey’’图像序列所得到的图像清晰度评价函数曲线。。Mickey'J雹像序列的图像清晰度评价函数由线图3-4“Mickey”图像序列的图像清晰度评价函数曲线“Mickey"图像序列是在长短物距情况下拍摄的,且目标与背景距离较远,反映在图像清晰度评价函数曲线上的性质就是双峰间隔较大。从图中可以看出,这三条曲线均存在双峰。但采用LaplacianofGaussian算子得到的清晰度评价函数曲线不仅出现了毛刺而且还出现明显偏差,最大峰对应的是对背景聚焦的图像,而次最大峰对应的才是对目标聚焦的图像,进行聚焦图像搜索的时候就会搜索到对背景聚焦的图像上,可见LaplacianofGaussian算子不适合在这种情况下的自动聚焦。而基于Sobel算子和Roberts算子的清晰度评价函数曲线性能要LLLaplacianofGaussian算子的曲线性能好得多,均满足无偏性,且Sobel算子得到的清晰度评价函数曲线在聚焦位置(包括目标聚焦位置和背景聚焦位置)处的锋利性更明显。根据图3.2,图3.3和图3.4的研究可以发现,在长短物距情况下,基于Sobel算子的清晰度评价函数有三个优点。首先,无论是在长物距下还是在长短物距下,基于Sobel算子的清晰度评价函数的峰值两边均满足单调性。它不会像基于Roberts算子和LaplacianofGaussian算子得到的清晰度评价函数曲线一样出现毛刺。其次,基于Sobel算子的清晰度评价函数的.24.笙三童兰主兰2111竺王堕重堕堡鲨笙里鏊塑塞些皇奎兰堡主竺窭竺堂垡鲨壅一无偏性也很好。在长物距下出现单峰,在长短物距下出现双峰,且最大峰值对应着目标聚焦图像,次最大峰值对应着背景聚焦图像。它不会像基于Roberts算子币tlLaplacianofGaussian算子得到的清晰度评价函数曲线那样出现峰值偏差。第三,基于Sobel算子的清晰度评价函数在接近聚焦位置时,清晰度评价函数值的锋利性明显,峰值两边的变化幅度相对于其它两种算子要大很多,即在峰值两侧曲线上升和曲线下降的趋势要比其它两种算子明显很多。综合以上Sobel算子相对于Roberts算子和LaplacianofGaussian算子的三点优势,可以得到,在长短物距情况下,基于Sobel算子的清晰度评价函数性能要比基于Roberts算子和LaplacianofGaussian算子所得到的清晰度评价函数的性能好。3.3阈值取值对于基于Sobel算子的清晰度评价函数性能的影响从3.2节的讨论可以知道,在长短物距情况下,基于Sobel算子的清晰度评价函数性能要比基于Roberts算子和LaplacianofGaussian算子所得到的清晰度评价函数的性能好。但是,这一结论建立的前提是,基于Sobel算子的清晰度评价函数的阈值取得恰当。在基于微分算子的清晰度评价函数中使用阈值的作用是进行边缘检测。当得到的微分算子值大于阈值时,就认为该像素点是边缘上的点,就将微分算子的值置为1;当得到的微分算子值小于阈值时,就认为该像素点不是边缘上的点,就将微分算子的值置为0。图像越清晰时,图像的边缘信息越丰富,得到的边缘点也就越多;当图像越模糊时,图像的边缘信息也越模糊,得到的边缘点就越少。这样采用不同的阈值会得到不同的清晰度评价函数曲线,可见它对清晰度评价函数的性能有至关重要的影响【16,17,34,”1。图3.5,3-6,3-7分别为“Computer”图像序列、“Clock"图像序列及“Mickey"图像序列在采用基于Sobel算子的清晰度评价函数取不同阈值时得到的结果(其中thresh的取值是在Matlab软件使用edge函数时设置的阈值)。南京邮电大学硕士研究生学位论文第三章基于Sobel算子的清晰度评价函数’CompMo阍像序列的图像清晰度评价函数曲线刀惑…。、、I/’一-—p扣I—■一Thmsh=O—曲~Thresh=O01·—t遗≮\√。∥鹳、”f《≥.—。B—Thmsh=O∞——}一Thmsh=OThmsh=O.5,1ll‰{}X、、o管‘lbt|||||||||||||||||||||||||||||||,I¨_f,k一;、j■?嘞::.童∥—一9k~,图像序列号图3—5阈值对清晰度评价函数曲线的影响(“Computer”图像序列)k’^。积毒恻理:≯∥。Clock嘲像序列的图像清晰度评价函数曲线r氆沁∥。鼍I≮。一卜_十——}∥鼍袋圜¥醚普罄。矽矿‘f▲‰矿凇“/I|刚尹i拉蔷{誊趟艘鳓壤%—_1一Thresh=O+k—妒Thresh--O.01—-E卜Thmsh=O.∞—卜Thmah=O.1Thresh=05瞄Ⅵk一…图3.6阈值对清晰度评价函数曲线的影响(“Clock”图像序列)‘Mickoy嘲像序列的图像清晰度评价函数曲线图像序列号图3-7阈值对清晰度评价函数曲线的影响(“Mickey”图像序列)在这三幅图中thresh取值为0表示没有采用阈值时的情况。从三幅图中可以看出,当没有采用阈值时,三种图像序列的清晰度评价函数曲线性能均不好。曲线均比较平旦,而且-26..堕塞唑皇查堂堕主竺塑竺堂堡笙茎笙三皇茎主121竺!簦至竺堕堕壁鲨笪鱼垫还有许多毛刺,这种曲线非常不利于进行聚焦。而随着阈值逐渐增大,曲线的锋利性也逐渐增强,曲线的聚焦效果也越来越好。但是当阈值到达一定值后,就会出现边缘点为零的情况,如这三幅图中thresh取值为0.5时的曲线。可以发现,在这三幅图中,并没有画出thresh取值为O.5时的清晰度评价函数曲线。原因是,当thresh取值为0.5时,用Sobel算子得到的微分值均小于阈值,用阈值判断时,图像中没有边缘点,所以,最大的清晰度评价函数值为零,在进行归一化时,导致所有清晰度评价函数值均为无穷大。在将采用基于Sobel算子的清晰度评价函数与基于Roberts算子和LaplacianofGaussian算子所得到的清晰度评价函数进行比较时,这三组图像所选的阈值分别为0.1,0.1,O.3。从上面分析可知,在采用基于Sobel算子的清晰度评价函数时必须采用阈值。但是,选用的阈值不能太大,否则会导致无法检测到边缘点;选用的阈值也不能太小,否则曲线会出现毛刺且锋利性也不够。可见,基于Sobel算子的清晰度评价函数性能对闽值很敏感,这也是该算法的一个缺点。因为,在实际聚焦时,很难根据不同的图像序列采用不同的阈值,只能根据固定的阈值进行聚焦。而这个阈值不可能适应所有的图像序列,所以往往会造成聚焦偏差,导致误判。不仅阈值对于基于Sobel算子的清晰度评价函数性能影响很大,实际上,阈值对于基于其它微分算子的清晰度评价函数影响也很大,!/IRoberts算子、LaplacianofGaussian算子等【16,17,34】。3.4本章小结在这一章中,论文主要分析了在长短物距下,分别基于三种算子(Sobel算子、Roberts算子和LaplacianofGaussian算子)的清晰度评价函数的性能。论文首先介绍了Sobe!算子的含义及其计算公式,然后提出了仿真流程。整个仿真流程是按照以下5个步骤执行的:采集图像序列、进行灰度变换、提取中心窗口中的图像、微分计算、清晰度评价函数值归一化。其中灰度变换和提取中心窗口中的图像这两步是在仿真前进行的预处理工作。由于采集到的图像是真彩色图像,其所占的空间较大,如果直接用于仿真计算,会导致计算量庞大。因此,在计算前,先将其变换成灰度图像,这样计算量会明显减小。为了进一步减小计算量,论文还采取中心窗口方法,这种方法主要是考虑到通常会将目标放置在取景框的中心。论文将取景框中心的1/9大小的图像取出作为感兴趣的图像,后面的计算只考虑图像序列中的感兴趣的图像,对于其它图像均不予考虑。经过这两步的处理,仿真时的计算量大幅度降低,有利于有效快速的进行聚焦。除了讨论长物距情况下的自动聚焦性能之外,为了更好讨论长短物距下的自动聚焦性塑塞塑皇奎堂堡圭婴壅圭兰垡笙壅笙三皇墨主!竺!竺!竺至塑堕堕塞堡笙里鏊能,论文将长短物距情况又分成两种情况:一种为聚焦目标离背景很近时的长短物距情况,另一种为聚焦目标离背景很远时的长短物距情况。这样,实验过程中拍摄的三组图像分别代表了这三种不同的聚焦情况。实验中对这三组图像分别采用了基于Sobel算子、Robe,s算子和LaplacianofGaussian算子的清晰度评价函数进行聚焦实验。论文发现,在长物距下,三种算子性能的差别不大。但是在长短物距情况下,基于Sobel算子的清晰度评价函数的性能要明显好于基于另外两种算子的清晰度评价函数的性能。最后,论文还就阈值的选定对基于Sobel算子的清晰度评价函数性能的影响进行了讨论,阐述了阈值在基于微分算子的清晰度评价函数性能中的重要作用。下一章,论文将提出另一种适用于长短物距情况下的自动聚焦方法,并将其与这一章所采用的方法进行比较。南京邮电大学硕士研究生学位论文第四章基于中心分块加权IL"T的清晰度评价函数第四章基于中心分块加权]OCT的清晰度评价函数根据第二章分析可以得到,在离焦状态下,数码相机成像系统是一个二维的高斯低通滤波器。离焦的图像可以认为是由于图像的高频成分经过低通滤波后受到了损失,因此图像变得模糊,离焦程度越大的图像,损失的高频分量也就越多。也就是,离焦的图像所含的高频分量要明显少于聚焦的图像所含的高频分量。这样,可以从频域角度出发,通过测量图像的高频分量含量,来确定图像是否聚焦。根据这一理论基础,本章提出了适用于长短物距下自动聚焦的基于中心分块加权DCT的清晰度评价函数。为了更好的说明该函数的优点,论文将其与传统高频分量方法进行了比较。4.1传统高频分量方法这里所说的传统高频分量方法【36,371就是指第二章中介绍的频域类清晰度评价函数之一离散余弦变换。它是将整幅图像进行DCT变换,去除直流分量,提取出高频分量作为该图像的清晰度评价函数值。图像序列中含有最多高频分量的图像就被认为是对目标聚焦的图像。这是一种简单且较易实现的方法。但是传统的高频分量方法有一个明显的缺陷,就是在计算时忽略了局部高频分量的变化【3引。在长短物距下,被拍摄的物体的物距并不是全部都远大于焦距,根据第二章对于长短物距下的清晰度评价函数性质分析可以知道,此时的清晰度评价函数曲线会出现“多峰"的情况。“多峰”的出现就需要对哪个是对目标聚焦的图像进行判断。一般最大峰值对应的图像就应该是对目标聚焦的图像,如果采用判断高频分量的多少来判断,就意味着该图像中的目标高频分量含量最多。所以,在存在“多峰”的情况下,局部高频分量的变化就显得格外重要。如果忽略了目标的局部高频分量变化,而背景的细节又比较丰富,则就会使背景的高频分量值大于目标的高频分量值,换而言之,就是最大峰值就会对应于背景聚焦的图像,从而会产生误判。所以,在长短物距情况下,应该要考虑局部高频分量的变化。本章中的基于中心分块加权DCT的清晰度评价函数正是基于这一点提出来的。4.2一种基于中心分块加才Y,DCT的清晰度评价函数基于中心分块加权DCT的清晰度评价函数属于频域类清晰度评价函数,它是对传统高频分量方法的一种改进。该函数是针对长短物距情况下的自动聚焦提出来的,但是实验证南京邮电大学硕士研究生学位论文第四章基于中心分块加权D(Tr的清晰厦评价函数明在长物距该方法也同样适用。4.2.1基于中心分块加衫tOCT的清晰度评价函数的提出该方法首先以图像的中心为原点将图像划分为四个象限。然后从原点开始在四个象限中以发散状方式进行分块,同时根据这些块与原点的距离对块赋予不同的权重。最后对每个小块分别进行DCT变换,得到高频分量和,作为最终该图像清晰度评价函数值‘251。假定在聚焦过程中得到的一系列图像为Z(x,Y),大小均为MxN,后为图像的序列号,每个块的大小为txt,分块的坐标为(f,J)(一m≤j≤m,一刀≤,≤刀),对应的DCT变换系数为F.,(“,1,)。使用该方法得到的清晰度评价函数值q为:q:芝之『exp(一(IfI·怫)f艺艺l气(甜∽l一阮(o,o)1]]G0=max(q)其中Gn所对应的图像就是对目标聚焦的图像。(4—1)(4—2)基于中心分块加权DCT的清晰度评价函数与传统高频分量方法相比有两个特点。首先该方法突出了中心区域的图像的重要性,并且考虑了局部高频分量的变化,主要是通过中心分块来实现的,如图4.1所示。标记为“1”的图像块是最先分块得到的,标记为“2”的图像块是第二次分块得到的,标记为“3"的图像块是第三次分块得到的,依此类推。可见该分块的方法是成发散状的,先对图像中心区域进行分块,再对图像四周进行分块。分块的目的主要是为了得到更多的局部高频分量的变化。理由是,对于区域很小的图像来说,细节的任何细微变化都表现为高频分量能量的增加‘361。这样可以通过分块,将整幅图像划分为各个子图像。当子图像出现细微变化时,对其进行DCT变换,就能够得到其局部的高频分量的变化。进行发散状分块的目的主要是为了突出中心区域的图像的重要性。在拍摄图像时通常将目标放置在取景框的中央,因此,取景框中心区域的图像就是最重要的目标图像。先对中心图像进行分块,就能更大程度的保留目标图像的信息。而对四周进行的均匀分块时使整个分块操作上下左右对称,也便于后面根据每个块的坐标进行加权操作。南京邮电大学硕士研究生学位论文第四章基于中心分块加权DCT的清晰度评价函数心图4—1分块图第二个特点是该方法还给图像块赋予了权重。根据分块距图像中心距离的远近给予不同的权重。离图像中心越近的块,权重越大;离图像中心越远的块,权重越小。但是距图像中心距离相等的块所赋予的权重一样。如图4.1中,标记为“1”的所有分块权重一样,标记为“2"的所有分块权重一样,且标记为“2"的分块权重要小于标记为“l"的分块权重,依此类推。这样选择的理由是,一般越靠近取景框边缘的块越可能是背景,而越靠近取景框中央的块越可能是目标。所以,对于离中心近的块给予其高频分量值较大的权重,而离中心远的块给予其高频分量值较小的权重。这样就可以使由目标的细节变化而导致的局部高频分量变化更加明显,与此相对的,由背景的细节变化而导致的局部高频分量变化就被削弱了。为了满足这样的权重要求必须选择一种在(一oO,O)上单调递增而在(0,佃)上单调递减的加权函数。论文中采用的加权函数为exp(一04+I巾)。黼xp(-IxI)类的函数的曲线如图4—2所示。从图4—2中可以看出,exp(一H)类函数在(一∞,o)上单调递增而在(o,佃)上单调递减,满足所需的加权函数性质。当得到每个分块的高频分量后,用exp(一qil+lJl))加权,这样图像中心处分块的高频分量加权系数为l,而其它分块根据自己的坐标的绝对值之和,UPl,l+lJJ的和,来确定加权系数,l'l+lJI的值走93v,说明越远离图像的中心,其加权系数越小。这样,就可以通过加权函数来赋予每个分块不同的权重,从而突出目标的高频分量变化幅度,避免误判。南京邮电大学硕士研究生学位论文第四章基于中心分块加权DCT的清晰度评价函数图4-2Y=exp(一Ixl)的函数曲线图4.2.2确定分块的大小基于中心分块加权DCT的清晰度评价函数中最重要的参数就是分块的大小,论文中用参数f表示。块的大小将会影响评价函数的性质p61,如果分块选取恰当,就可以正确聚焦,但若选取不当,就可能会造成曲线产生偏差,造成误判。因此,该参数的选择在整个算法中起到了举足轻重的作用。论文对块的大小选取做了实验,并从聚焦的正确性和聚焦速度两个方面进行了分析。论文将“Computer”图像序列、“Clock"图像序列和“Mickey”图像序列均做了分块实验,分块的大小取值分别为f=4,f=8,t=16,f=32。图4.3是“Clock"图像序列在不同的分块条件下得到的清晰度评价函数曲线,在(a)、(b)、(c)和(d)曲线中的分块大小分别为4×4、8×8、16x16和32x32。"Clock'团像序列的清晰度评价函数曲线O锄∞啡吖们吖%阜蔹睡¥醚葺毫帖==甄譬-cIock圈像序列的清晰度评价函数曲线O=协……b…¨÷一≠:《…b…一≥……;%’’K五葛固像序列号田像序列号(a)t=4(b)t=8南京邮电大学硕士研究生学位论文第四章基于中心分块加权DCT的清晰度评价函数-cIock。图像序列的清晰度评价函教曲线护3乃0.{;广毪一!;必\毛}.j…f{¨《/、|智08强睡摹√’/,f.{墓n7倒气b凄。。≯{j;≮:、k∥。产kbH…“》‰加五加葛图像序列号(c)f=16(d)f=32图4-3“Clock”图像序列在不同的分块条件下的清晰度评价函数曲线从图中可以看出,当分块大小为32x32时,在第19帧和第20帧时得到的清晰度评价函数值相等,出现了偏差。在此情况下,这种大小的分块方法不适合。当分块大小为4x4、8×8、16x16时,清晰度评价函数曲线出现了明显的双峰,且峰值均满足无偏性。只是,这三种分块方法在图像非常模糊时,即图4.3(a)中的第4帧处,图4.3(b)中的第3帧处和图4—3(c)中的第3帧处均出现了微小的毛刺,不过,在图像接近清晰时,曲线性质均表现良好。因此,从聚焦正确性的角度来看,这三种分块方法均比较好。从聚焦速度的角度来看,论文还对这四种分块方法所需的时间进行了比较(这里计算的时间是采用所提算法计算高频分量时平均每幅图像所需的时间),如表4.1所示。表4.1“Clock”图像序列的四种分块方法的时间比较1分块大小4x48.58x83.44216x162.14832x321.529『算法时间(s)从表中可以看出,四种分块方法所消耗的时间由长到短的顺序为:4x4、8x8、16x16、32x32。从前面的分析可知,分块大小为32x32时清晰度评价函数曲线性能不好,所以从聚焦速度的角度来看,分块大小为16x16时聚焦速度最快。综合考虑这两方面的因素,应采用16x16大小的分块。图4.4是“Mickey"图像序列在不同的分块条件下得到的清晰度评价函数曲线,同样,在(a)、(b)、(c)和(d)曲线中的分块大小分别为4×4、8×8、16x16和32x32。在确定该情况下的分块大小时,依然从聚焦正确性和聚焦速度这两方面进行考虑。南京邮电大学硕士研究生学位论文第pq章基于中心分块加权DCT的清晰度评价函数。MIckey圈像序列的清晰度评价函数曲线O=Bl器腰毒基薹i≯!.薄≥剥I._≥.』j●:拉≥ljIII害_}』I_≥』整jiii型。.I;ii(a)t=4。M雠key咽像书刊的清晰度评价函数曲线{l=坷∞∞叮∞f茂≈∥。飞。?;‘厂;。、,鼍糍睡S毯蕾曙。{‘(c),=16;’\(d)f=32图4-4“Mickey”图像序列在不同的分块条件下的清晰度评价函数曲线从图中可以看出,(a)、(b)图中的清晰度评价函数曲线出现了偏差,其对背景聚焦时的高频分量值要高于目标聚焦时的高频分量值,即最清晰图像对应的是对背景聚焦的图像,因此,4x4、8x8这两种分块方法不能用于聚焦图像。再比较分块大小为16x16和32x32时两条清晰度评价函数曲线可以发现,分块大小为32x32时,对背景聚焦的图像的高频分量值与对目标聚焦的图像的高频分量值相差很少,说明分块大小为32X32时的清晰度评价函数对图像的细节变化不太敏感。而分块大小为16x16时,可以从图中看到对背景聚焦的图像的高频分量值与对目标聚焦的图像的高频分量值相差较大,要比分块大小为32x32时的清晰度评价函数敏感很多。可见,从聚焦正确性的角度出发,分块大小为16x16时的清晰度评价函数效果最好。从聚焦速度的角度来看,论文也对这四种分块方法所需的时间进行了比较,如表4.2所示。表中可以看出,四种分块方法所消耗的时间由长到短的顺序依然为:4x4、8×8、16x16、32×32。可见分块大小为16×16的清晰度评价函数聚焦速度不算很慢。综合考虑这两方面的因素,应采用16x16大小的分块。南京邮电犬学硕士研究生学位论文第四章基于中心分块加权DCT的清晰度评价函数表4—2“Mickey”图像序列的四种分块方法的时间比较1分块大小l算法时间(s)4x43.2458×81.33216x160.79132×320.597I可见,在长短物距下,不论是目标与背景距离较远,还是二者相距较近时,均可以采用分块大小为16x16的基于中心分块加权DCT清晰度评价函数。图4.5是长物距情况下,“Computer”图像序列在不同的分块条件下得到的清晰度评价函数曲线,同样,在(a)、(b)、(c)和(d)曲线中的分块大小分别为4x4、8x8、16x16和32x32。。Compmer圈像序列的清晰度评价函数曲线j{喜lA·---·—·--一t=4…c?一1=B一—■_t=-16—{}一t=32.}量扩9&》…≯≮、‘‘N崤蘸:j玉_日~哗'盔毓≤图4-5“Computer”图像序列分块比较图从聚焦正确性来看,分块大小对于该序列的影响不是很大,四条曲线几乎是重合的。从聚焦速度的角度来看,论文也对这四种分块方法所需的时间进行了比较,如表4—3所示。从表中可以看出,四种分块方法所消耗的时间由长到短的顺序与“Clock"图像序列和“Mickey"图像序列一样。这样,从聚焦正确性和聚焦速度来看,应该选用分块大小为32x32的清晰度评价函数。但是在对图像进行聚焦时,如果对应不同的图像序列选用不同的分块大小,需要数码相机具有很强的自适应性,能够快速判断图像序列的复杂程度,而这在理论上很难进行定量的确定。所以,为了能够具有比较简单的一致性,论文依然在长物距情况下采用分块大小为16x+16的清晰度评价函数。表4-3“Computer”图像序列的四种分块方法的时间比较分块大小4×42.1888x80.8616x160.5332,x320.383I算法时间(s)从以上对三组序列的不同分块方法得到清晰度评价函数曲线性能的分析可以充分了解分块大小的重要性。当分块较大时,得到的图像的细节变化信息不多,有可能导致对目南京邮电入学硕七研究生学位论文第pq章基于中,t1,分块加权DCT的滑晰度评价函数标聚焦的图像的高频分量值并不高于其它离焦图像的高频分量值,如图4.3(d)所示,从而在聚焦过程中,造成误判。当分块较小时,虽然可以增加对目标聚焦的图像的细节变化信息,但是也同时会增加对背景聚焦的图像的细节变化信息,有可能导致对背景聚焦的图像的清晰度评价函数值要高于对目标聚焦的图像的清晰度评价函数值,如图4.4(a)和(b)所示,这样,同样会导致误判。因此,经过比较分析,综合聚焦正确性和聚焦速度两方面考虑,论文将算法中的分块大小定为16x16,实验发现,不论是在长物距下还是长短物距下,该分块方法均能适用。4.3仿真流程及结果分析本算法所基于的仿真环境为:操作系统为WindowsXP,CPU为IntelPentiumMprocessor1.70GHz,内存为512Mb的PC机,佳fl皂EOS350D数码相机。实验所使用的三组图像序列以及仿真流程均与第三章中所使用的三组图像序列及仿真流程一样。在实验之前也进行了第三章所使用的颜色转换处理和中心窗口方法,来降低计算量,提高运算的速度。因为基于中心分块加权DCT的清晰度评价函数是传统高频分量方法的一种改进方法,因此,论文将对这两种方法进行比较,来说明所提方法的优越性。图4.6为分别采用基于中心分块加权DCT方法和传统高频分量方法所得到的“Computer"图像序列的清晰度评价函数曲线图。。Compute阍像序列的清晰度评价函数曲线图4—6“Computer”图像序列的清晰度评价函数曲线从图中可以看出两种方法所得到的清晰度评价函数曲线的无偏性均很好,峰值两边均满足单调性。只是在曲线的锋利程度上,二者存在差别。基于中心分块加权DCT的清晰度评价函数曲线的锋利程度要强于传统高频分量方法所得到的清晰度评价函数曲线的锋利程度,说明基于中心分块加权DCT的清晰度评价函数对于图像清晰程度的敏感性要高-36.堕塞坚皇奎兰塑主婴壅生兰篁笙壅于传统高频分量方法。蔓婴皇兰三主:垒坌垫垫壑旦坚堕塑堕壁堡垒里垫图4.7为分别采用基于中心分块加权DCT方法和传统高频分量方法得到的“Clock”图像序列的清晰度评价函数曲线图。·ciock'曼像序列的清晰座评价函数曲线图4-7“Clock”图像序列的清晰度评价函数曲线从图中可以看出,采用传统高频分量方法得到的清晰度评价函数曲线出现了偏差。曲线中的最大峰对应的图像是对背景聚焦的图像,而次最大峰对应的图像为对目标聚焦的图像。这样,采用该种方法进行自动聚焦时,就会聚焦到对背景聚焦的图像上。因此,该方法不满足无偏性。当采用基于中心分块加权DCT的清晰度评价函数时,从图中可以看出,曲线满足无偏性,.最大峰对应为对目标聚焦的图像,且双峰两边也较为峰利。只是在第2帧上出现了较小的毛刺,而曲线的其它部分则较为光滑。图4-8为“Mickey"图像序列的清晰度评价函数曲线图。从图中可以看出,两种方法得到的清晰度评价函数曲线存在着明显差别。采用传统高频分量方法得到的清晰度评价函数曲线依然出现了偏差,不满足无偏性。其最大峰对应的图像是对背景聚焦的图像,而次最大峰对应的图像才是对目标聚焦图像。而采用基于中心分块加权DCT方法时,清晰度评价函数曲线性能明显要好于采用传统高频分量方法所得到的清晰度评价函数曲线的性能。它聚焦正确,满足无偏性。虽然图中曲线不是很光滑,但是在峰值两边的清晰度评价函数值满足单调性,没有出现毛刺,这对于正确快速搜索十分有利。南京邮电大学硕士研究生学位论文第四章基于中心分块加权DCT的清晰度评价函数。Mickeyl嚣像序列的清晰度评价函数曲线专专壹澄及碧舅砖。.商》爹.,‘I。l基于中心分块加权OCTfI—+一传统高频分置方法一\图4.8“Mickey”图像序列的清晰度评价函数曲线从上面对于三组测试图像序列的讨论来看,在长物距下进行自动聚焦时,采用传统高频分量方法和采用基于中心分块加权DCT方法得到的聚焦效果相差不多,只是基于中心分块加权DCT的清晰度评价函数曲线要更锋利一点。但是在长短物距下,不论是目标和背景相距较远时,还是目标和背景相距较近时,采用基于中心分块加权DCT方法得到的聚焦效果均要好于采用传统高频分量方法得到的聚焦效果。采用传统高频分量方法得到清晰度评价函数曲线不满足无偏性,在聚焦过程中会聚焦到对背景聚焦的图像上。而采用基于中心分块加权DCT方法时,清晰度评价函数曲线满足无偏性,能正确聚焦。两者性能相差较大的主要原因是,在长短物距下,采用基于中心分块加权DCT方法的优势更加突出。传统高频分量方法是将整幅图像进行DCT变换,它忽略了图像局部高频分量变化信息,导致对背景聚焦的图像的高频分量值高于对目标聚焦的图像的高频分量值。而采用基于中心分块加权DCT方法时,它不仅通过中心分块方法考虑了图像局部高频分量的变化,突出了目标的重要性,而且还通过加权的方法使目标的高频分量值变化更加明显。因此,综合长物距下的聚焦效果和长短物距下的聚焦效果,基于中心分块加权DCT的清晰度评价函数的性能要好于传统高频分量方法的清晰度评价函数的性能。4.4中心分块加权I)CT方法与Sobel算子方法的性能比较在第三章中,论文将基于Sobel算子、Roberts算子和LaplacianofGaussian算子的清晰度评价函数进行了比较,发现基于Sobel算子的清晰度评价函数性能要好于基于其它两个算子的清晰度评价函数性能。在这一章中,论文提出了一种基于中心分块加权DCT的清晰度评价函数,通过与传统高频分量方法进行比较,说明了所提方法的良好性能。在这一节中,论文将从清晰度评价函数所属类别、聚焦的正确性、聚焦速度、适用环境四个方.38.南京邮电大学硕士研究生学位论文第四章基于中心分块加权DCT的清晰度评价函数面进行对所提的这两种算法进行比较,以更好的说明两种算法的优劣性。1.清晰度评价函数所属类别按照第二章对于图像清晰度评价函数的分类可知,基于Sobel算子的清晰度评价函数与基于中心分块加权DCT的清晰度评价函数分属于不同类别,从而采用了不同的评价方法。基于Sobel算子的清晰度评价函数属于梯度函数。图像梯度反映了该图像的灰度变化率的大小。当图像模糊时,图像中边缘细节部分严重损失,图像的灰度变化不明显,梯度值相对较小:相反,当图像清晰时,图像中的边缘细节部分明显,灰度变化起伏变大,梯度值也相对较大。基于中心分块加权DCT的清晰度评价函数属于频域类评价函数。这类函数主要基于离散余弦变换,离散余弦变换的高频分量对应着图像边缘信息。离焦程度越大,则损失的高频分量越多,图像也就越模糊;相反,离焦程度越小,则损失的高频分量越少,图像也就越清晰。可见,这两种方法是从不同的角度出发,对图像序列的清晰度评价函数值进行计算的。2.聚焦的正确性从第三章3.4节的分析可以知道,基于Sobel算子的清晰度评价函数的性能与阈值的取值有关。如果阈值取值不当,曲线性能下降,就会造成聚焦图像的位置偏移,导致误判。从阈值取值来看,选用的阈值不能太大,否则会导致无法检测到边缘点;选用的阂值也不能太小,否则曲线会出现毛刺且锋利性也不够。可见,基于Sobel算子的清晰度评价函数性能对阈值很敏感,阈值的大小直接决定了该清晰度评价函数的性能。因此基于Sobel算子的清晰度评价函数性能在聚焦正确性上的稳定性不高。而基于中心分块加权DCT方法(分块大小为16x16)与阈值无关,仅凭借每幅图像所含的高频分量多少来判断聚焦图像的位置。而且该算法考虑了图像局部高频分量的变化,突出了目标的重要性,而且还通过加权的方法使目标的高频分量值变化更加明显,所以该算法在聚焦过程中,特别是长短物距情况下,表现出了良好的性能。因此,在聚焦正确性方面,由于阈值对基于Sobel算子的清晰度评价函数性能的影响,基于中心分块加权DCT的清晰度评价函数的性能要比基于Sobel算子的清晰度评价函数性能更稳定。3.聚焦的速度由于基于Sobel算子的清晰度评价函数与基于中心分块加权DCT的清晰度评价函数采用的是不同的图像清晰度评价方法,前者是从图像梯度出发,后者是从图像的高频分量出发,因此,两种方法的速度明显不同。从理论上分析可知,采用图像梯度的基于Sobel算子的清晰度评价函数的运算量要明显小于既需要发散状的分块又要进行DCT变换的基于中心分块加权DCT的清晰度评价函数。.30.南京邮电大学硕士研究生学位论文第四章基于中心分块加权DCT的清晰度评价函数“Computer"图像序列、“Clock”图像序列和“Mickey"图像序列分别采用这两种方法计算每幅图像所需平均时间如表4-4所示。表4-4两种算法聚焦时间比较基于Sobel算子(s)0.6450.7950.085—、、\“Computer”图像序列“Clock”图像序列“Mickey”图像序列基于中心分块加权DCT(s)O.532.1480.791从表中可以发现,“Computer"图像序列,基于中心分块加权DCT的清晰度评价函数的运算速度要稍微快于基于Sobel算子的清晰度评价函数的运算速度。主要原因与Matlab软件的设计有关。因为DCT变换是一种常用的变换,Matlab软件对其优化得很好,运算速度很快。论文将“Computer”图像序列采用传统高频分量方法进行计算时平均每幅图像只需0.065s。因此,在高速DCT变换的有力支持下,有可能使中心分块加权DCT方法的速度要高于基于Sobel算子的速度。而在“Clock”图像序列和“Mickey”图像序列的运算速度方面,即使Matlab软件的DCT变换很快,但是基于中心分块加权DCT的清晰度评价函数与基于Sobel算子的清晰度评价函数相比要慢很多,其在速度上的劣势显得更加明显。总的来说,在聚焦的速度方面,基于Sobel算子的清晰度评价函数要明显快于基于中心分块加权DCT的清晰度评价函数的聚焦速度。4.适用环境从前面的聚焦的正确性和聚焦速度两个方面对两种算法的比较来看,这两种算法有各自的优点。在聚焦正确性方面,由于阈值对基于Sobel算子的清晰度评价函数性能的影响,基于中心分块加权DCT的清晰度评价函数的性能要比基于Sobel算子的清晰度评价函数性能更稳定。在聚焦速度方面,基于Sobel算子的清晰度评价函数要明显快于基于中心分块加权DCT的清晰度评价函数的聚焦速度。因此,这两种聚焦方法可以根据需要运用在不同的场合。当对聚焦的精确性要求很高,且对聚焦的速度没有太高要求时,可以考虑采用基于中心分块加权DCT清晰度评价函数。当要求聚焦的运算量小,聚焦速度快时,在满足聚焦正确性的情况下,可以考虑采用基于Sobel算子的清晰度评价函数。论文正是基于这一点,在下一章的自动聚焦实验平台实现时采用的是基于Sobel算子的清晰度评价函数,而没有采用基于中心分块加权DCT的清晰度评价函数。4.5本章小结在这~章中,论文提出了一种基于中心分块加权DCT的清晰度评价函数。这种清晰-40.塑室塑皇奎兰堡主婴壅竺兰垡笙奎度评价函数是对传统高频分量方法的一种改进。笙婴童茎三!:堂坌鉴垫壑里塑箜塑堕窒鲨竺里墼该方法首先以图像的中心为原点将图像划分为四个象限。然后从原点开始在四个象限中以发散状方式进行分块,同时根据分块与原点的距离对分块赋予不同的权重。最后对每个分块分别进行DCT变换,得到高频分量和,作为最终该图像清晰度评价函数值。基于中心分块加权DCT的清晰度评价函数相比较传统高频分量方法具有两个特点。一个特点是该方法通过采用中心分块的方法突出了中心区域的图像的重要性,并且考虑了局部高频分量的变化。另一个特点是通过加权函数来赋予每个分块不同的权重,从而突出目标的高频分量变化幅度,有效避免误判。在基于中心分块加权DCT的清晰度评价函数中分块的大小对函数性能有重要影响。论文通过对三组图像序列分析,综合聚焦正确性和聚焦速度两方面考虑,论文将算法中的分块大小定为16x16。不论在长物距下还是长短物距下,该分块方法均能适用。论文为了更好的说明基于中心分块加权DCT的清晰度评价函数的优越性,将其与传统高频分量方法进行了比较。通过对三组图像序列的实验可以发现,在对图像的聚焦正确性上,基于中心分块加权DCT的清晰度评价函数性能要明显好于传统高频分量方法的性能。最后,论文还将基于中心分块加权DCT的清晰度评价函数与第三章所采用的基于Sobel算子的清晰度评价函数从清晰度评价函数所属类别、聚焦的正确性、聚焦速度、适用环境这四个方面进行了比较。南京邮电大学硕士研究生学位论文第五章基于BF533的自动聚焦算法的实验平台的实现第五章基于BF533的自动聚焦算法的实验平台的实现这一章中,论文将介绍如何通过实验来验证本文提出的自动聚焦算法的有效性。论文通过搭建一个实验平台来进行验证。实验平台为ADI公司的BF533仿真开发系统,主要包括PC机、BF533开发板和VisualDSP++仿真软件。实验平台分为软件部分和硬件部分。实验平台的软件部分最主要的是自动聚焦的程序和图像采集和显示程序,它是整个实验的核心部分;此外还有仿真系统提供的JTAG仿真器,它主要用于将自动聚焦程序通过JTAG口移植到BF533开发板上。实验平台的硬件部分除了PC机以外主要包括:一台SONYEVI.D100摄像机、一块BF533开发板、一根VISCA控制线、一根串口交叉线,一根串口顺连线和一台监视器。将这两部分结合起来,就构成了整个实验平台的系统。通过它们的工作,来完成对自动聚焦算法验证与实现。5.1实验平台的软件部分自动聚焦算法的实验平台系统的软件部分主要是自动聚焦算法和图像采集与显示。自动聚焦算法是指清晰度评价函数和寻优搜索算法。首先需要选定一种自动聚焦算法,该算法既要有一定的聚焦正确性,也要有较高的聚焦速度。当选定清晰度评价函数后,为了得到正确的聚焦图像,需要用寻优搜索算法来搜索。该搜索算法的选取对于聚焦系统的性能也会产生一定的影响。图像采集主要是将图像按照需要的格式读取至DSP板中,便于在DSP中对图像进行操作。最后通过监视器来观察整个自动聚焦过程中拍摄图像的变化情况,以确定是否正确聚焦。整个自动聚焦系统的实验平台是基于BF533开发板的。如何将自动聚焦程序下载到DSP++软件和仿真器。ADI公司提供一套完整的ADSP.BF533软硬件开发工具,包括VisualDSP++软件与仿DSP++软件通过图形窗口的方式和用户进行信息交换,可以在窗口中进行工言与硬件结合紧密,指令代码短,占用内存少,适合运算速度要求高的场合,而C/C抖基DSP++环境下建立工程,从而进行调试。VisualDSP++软件的界面如图5—1.42.5.1.1自动聚焦程序的移植过程BF533开发板上进行运行,这主要依靠Visual真器。Visual程管理,编辑,编译和调试程序,提高了编程效率。同时支持汇编语言和C/C++,汇编语本脱离硬件,可读性和可移植性强,开发效率高【4】o因此,自动聚焦系统的自动聚焦算法就通过在Visual所示。南京邮电大学硕士研究生学位论文墨烹雾等胃黑呵黑=●——黜。10_.●j三墨=1”第五章基于BF533的自动聚焦算法的实验平台的实现图5-1VisualDsP++软件的界面实验中使用的仿真器是ADDS.BF533一HPUSB—ICE。仿真器的作用是对ADSP·BF533实现全仿真。通过该仿真器测试访问口,监视和控制目标板上的处理器,而且还可以对存储器、寄存器和堆栈内容进行检查和修改。实验中,将仿真器端连接到PC机的USB接口上,另一端连接到BF533开发板的JTAG接口上的。当运行VisualDSP++时,就可以通过JTAG仿真器|_}{BF533上的JTAG口将自动聚焦程序移植到BF533芯片中,对其进行硬件仿真。s.10清晰度评价函数的选取在自动聚焦系统中,一个关键的问题是选取恰当的清晰度评价函数。只有清晰度评价函数的件能优良,才能得到』下确的聚焦位置,也能便于后续的寻优搜索算法的快速搜索。在第二章2.5节中指出,一个性能良好的清晰度评价函数必须满足无偏性好、灵敏性高、信噪比高的特点,目在K物距下应满足单峰的特性,而在长短物距下应满足多峰的特性。另外,得到的清晰度评价函数曲线,应尽量光滑,没有毛刺,且峰值两边均满足单调性,锋利性强。当然,考虑到DSP的运算速度问题以及计算的性能,移植到DSP中的算法还需满足讣算量小的特点,这样才能有效快速的进行白动聚焦。在第三章和箱四章中分别提出了基于Sobel算予的清晰度评价函数和基于中心分块加权DC'I的清晰度评价函数,并在第四章44节对这两种与法从清晰度评价函数所属类别、聚焦的正确性、聚焦速度、适削环境这四个方面进行比较,得到了一些有用的结论。在累焦正确性方面,由丁闽值对基于Sobel算子的清晰度评价函数性能的影响,基于中心分块加权DCT的清晰度评价函数的性能耍比基于Sobel算子的清晰度评价函数性能更稳定。在堕室塑皇奎兰堡主婴壅生兰垡笙壅笙墨耋茎王!墅!!塑旦垫鍪垡兰鎏塑塞墼兰鱼塑塞翌聚焦速度方面,基于Sobel算子的清晰度评价函数要明显快于基于中心分块加权DCT的清晰度评价函数的聚焦速度。由于清晰度评价函数要移植到DSP中,对于运算速度的要求比较高,所以从工程性的角度出发,在DSP中采用的自动聚焦函数为基于Sobel算子的清晰度评价函数。该函数在满足正确聚焦的同时,计算简单,更适合在DSP中使用。5.1,3寻优搜索算法的选取数码相机自动聚焦算法中的寻优搜索算法一般采用登山随动搜索法,即HCS(Hill.ClimbingSearch)算法【39,40】。HCS算法包括三个模式:查找模式、校准模式和观望模式。查找模式决定初始镜头的移动方向并查找到清晰度评价函数的最大值;校准模式和观望模式用于判断在查找模式中所找到的清晰度评价函数最大值所对应的图像是否是聚焦图像,即判断在查找模式中所找到的清晰度评价函数值最大值是否是全局最大值,即是一个消除局部最大值的过程。可见,HCS算法比较复杂,而且存在回程定位误差的问题【411。论文从易于实现的角度考虑,采用了一种简单的搜索算法,称为全局搜索算法。该算法的思想是:全程移动电机,采集图像。假设一共采集到Ⅳ帧图像,每采集一帧图像后,将得到的清晰度评价函数值保存在一个数组中。然后将在这个保存了清晰度评价函数值的数组中搜索最大值,该最大值所对应的图像即为聚焦图像。该算法的流程图如图5.2所示。全局搜索算法可以有效的避免毛刺的影响。主要原因是,该方法是将采集的所有图像的清晰度评价函数值均保存下来后,再搜索最大值,确定聚焦位置。这样,即使清晰度评价函数曲线有所波动,比如出现毛刺,只要该毛刺的清晰度评价函数值不大于聚焦图像的清晰度评价函数值,均可做出正确判断。虽然这种算法比较耗时,因为它需要计算所有帧的清晰度评价函数值,但是,只要清晰度评价函数值有较高的正确性,在搜索时也就能保持较高的正确性。南京邮电大学硕士研究生学位论文第五章基于BF533的自动聚焦算法的实验平台的实现将镜头拉至最远处,计算清晰度评价函数值并保存至数组中,/--1/\+否/删?\是\/▲计算清晰度评价函数值并保存至数组中,向前步进电机,/=i+1▲+从数组中搜索出最大值,并记录其在数组中的下标0根据最大值的下标,将镜头向反方向移动,回到聚焦位置图5-2全局搜索算法流程图5.1.4图像采集和显示在图像采集部分,论文采用的是基于BF533的PPIDMA模式。这里涉及到了PPI(并行外部接口)和DMA(直接存取器)两种操作。PPI是半双工形式,具有双向端口,最大可进行16位数据的输入输出。PPI有5个寄存器来控制它的操作。它们是PPI控制寄存器(PPICONTROL)、PPI延时计数寄存器(PPIDELAY)、PPI状态寄存器(PPISTATUS)、传输计数寄存器(PPICOUNT)以及每帧线路数寄存器(PPIFRAME)。在自动聚焦实验平台中,需要注意的是对于PPI_CONTROL寄存器中SKIPEN矛I]SKIP的设置。SKIPOE.跳的择选有来用是能EN功的过一些数据,SKIPEO的功能是选择一个输入数据流中的奇位部分还是偶位部分。在第三章3.3.1节说明了在仿真之前对图像序列进行了颜色转换的处理,将真彩色图像转换成灰度图像,这样可以节省降低计算量,节省计算时间。同样,在实验平台中也需要经过这样处理,因为在自动聚焦过程只需用到灰度信息即可,对于色度信息就可以忽略了。因此,可以通过使能SKIP_EN,然后设置SKIP_E0来得到灰度信息,跳过色度信息。可见,这个功能对于自动聚焦系统非常重要,它能够有效的节省计算时间及DMA带宽。PPT的T作樟式丰要有两种:通用PPl模式和ITU.656PPI模式。通用PPI模式可以应用南京邮电大学硕士研究生学位论文第五章基于BF533的自动聚焦算法的买验平台的买现于各种数据采集和数据传输的场合。在实验平台中,主要使用了ITU一656PPI模式,因为SONYEVI.D100摄像机的输出视频信号的格式是PAL制的。ITU.656模式有三种输入方式:活动视频方式、垂直消隐(VBI)模式和整场模式。这里,主要使用的输入方式是活动视频方式。活动视频方式适用于仅对一个域的活动视频部分感兴趣,而不是对其他的空白间隔时。PPI不读取在有效视频结束(EAV)和有效视频启动(SAV)同步符号间的任何数据及消隐间的数据。该模式下,控制字节序列不存入存储器,直接被PPI过滤。在实验平台中,是通过PPIDMA通道来进行视频信号的传送和接收操作的,存储到SDRAM中。每读取一帧图像,产生中断,进行其清晰度评价函数计算,然后移动摄像机的电机,使能DMA通道,再读取一幅图像,再进行类似操作,直至采集完毕在图像显示部分,论文采用的是SONY公司的监视器。用视频线将SONYEVI—D100摄像机采集到的视频信号从VIDEOOUT端口连接到监视器上,从而就可以方便的观察自动聚焦的全部过程。5.2实验平台的硬件部分硬件部分主要是指系统元件及串口通信部分。实验平台的系统元件包括:一台SONYEVI.D100摄像机、一块BF533开发板、一根VISCA控制线、一根串口交叉线,一根串口顺连线和一台监视器。串口通信部分是指通过DSP板上的串口发出的控制信号来控制摄像机电机的运动。5.2.1系统元件实验平台的系统元件包括:一台SONYEVI.D100摄像机、一块BF533开发板、一根VISCA控制线、一根串口交叉线,一根串口顺连线和一台SONY监视器。这一节主要对SONYEVI.D100摄像机和BF533开发板进行简单介绍。1.SONYEVI.D100摄像机EVI.D100摄像机分为两种制式,NTSC和PAL。在实验中采用的是PAL制的SONYSONYEVI.D100摄像机,如图5.3所示。该摄像机的像素为752(H)×582(v)。该摄像机在宽视场范围内旋转“顷斜运作安静,同时具有40倍变焦,可以快速稳定地自动聚焦以及通过自动曝光来控制背光补偿。另外还具有预置位,菊花形链接功能以及取得不同的数字图像效果。除此之外,它遵循SONYVISCA控制协议,通过RS.232C串口控制可以通过电脑对所连接的摄像机远程设置及对旋转/倾斜/变焦的远程控制。南京邮电大学硕±研究生学位论立第五章基于BF533的自动聚焦算法的实验平台的实现图5*3SONYEVI—D100(PAL)2BF533开发板BlackfinDSP是美固模拟器件公司(ADD与Intel联合开发的体现高性能系列结构的首款第四代DSP产品。其中Blackfin533是Blackfin系列中的一款高性能视频处理芯片,其主频最高能达600MHZ,每秒丌『处理1200M次乘加运算,具柏大量针对视频的专用指令,可以并行处理多条指令,这些特性使得该DSP芯片能处理广泛用于互联网的大量图像、声音、文本和数据流,适用于通信和各种互联网设备。Blackfin533开发平台如图5.4所示。此平台的中心处理器BF533是一种单核、加载/存储结构的DSP,拥有双MAC(multiply-accumulate.累加乘法)。除此之外,Blackfin533还具有以下特点:般40bit算法逻辑单元(ALU);~个40bit的移位器;4个视频ALU;一个8通道的32bit数据寄存器;148KB的片内存储器(16KB可作为指令Cache,32KB可作为数据Cache):动态电源管理功能等。另外,在Blackfin533的存储器结构巾,DMA控制器提供高带宽数据转移,能够完成L1/L2存储器和外部存储器之间编码或数据块转移,并且高速缓冲存储器可以设置,以便处理器和DMA可独立地访问。圈培羽即撂幂柯图5.4BF533开发平台框图5.2.2用摄像机代替数码相机的原因塑塞塑皇奎兰堡主婴窒竺堂垡笙奎笙至兰萎主!暨!!竺鱼垫鍪堡茎鲨塑塞鉴!垒塑塞翌在进行自动聚焦系统的实验平台的设计时,论文采用的图像输入设备是SONYEVI.D100。根据5.2.1节的介绍可知,它是一种摄像机,不是数码相机。数码相机和摄像机有三个方面的不同之处。首先,数码相机主要是用来拍摄静止画面的,有的也可以拍摄短时间的连续画面;而摄像机主要是用来拍摄动态画面的,且所有的都可以定格拍摄静止画面。其次,数码相机的分辨率很高,从300万像素到800万像素均很普遍,而摄像机的分辨率就相对较低,如SONYEVI.D100摄像机输出的PAL制图像格式752×582,这样大约为40万像素。最后,摄像机的光学变焦倍数要明显大于数码相机的光学变焦倍数。一般数码相机的光学变焦大约为3倍左右,因为其内部不允许成像器件移动;而摄像机的的光学变焦范围大约在10倍到20倍左右。虽然,数码相机与摄像机有以上不同之处,但是在论文中依然选取摄像机作为图像输入设备,主要考虑到三方面的原因。首先,二者的自动聚焦原理一样。它们均是通过由CCD输出且存于存储介质中的视频数字信号进行分析,算出清晰度评价函数值,根据清晰度评价函数值产生步进电机的控制信号来控制聚焦步进电机的移动,通过聚焦步进电机的移动去控制相机镜头的前进或后退,直到正确聚焦。这是能够用摄像机来代替数码相机的最重要的原因。其次,虽然在现实生活中,由于摄像机分辨率低,其拍出的图像明显没有数码相机清晰,但是它这种分辨率已经能够满足论文研究需要了。而且因为摄像机的分辨率较低,这样输入DSP的图像所占用的存储空间比较小。在计算图像清晰度评价函数值时复杂度会明显降低、计算量变小,所需的时间变短,聚焦速度就变得比较快。最后,数码相机很少有控制接口,而摄像机有控制接口的较多,比如SONYEVI.D100的VISCAIN/OUT接口。有了控制接口后,就可以用控制线对其进行控制了。反之,如果用数码相机,则需要将其拆卸,用导线连接电机才可以对其进行控制。可见,在控制操作方面,摄像机要比数码相机更加简单。因此,从上面分析可以得到,用摄像机代替数码相机进行自动聚焦在基本性能方面是可行的。5.2.3实验平台系统框图实验中,通过SONYEVI.D100摄像机来采集图像,然后通过视频线,传送至iJBF533开发板的SDRAM中,进行清晰度评价函数值的计算,得到移动电机的方向信息,接着通过由串口交叉线与串口顺连线组成的连接线和VISCA控制线,将控制信号送至SONYEVI—D100摄像机,同时将每移动一步电机得到的图像显示在监视器上。整个的实验平台系统框图如图5.5所示。南京邮电大学硕士研究生学位论文第五章基于BF533的自动聚焦算法的实验平台的实现图5.5实验平台系统框图5.3实验平台的串口通信从图5.5可以看出,BF533和SONYEVI.D100之间可以进行通信,而且BF533还能控制SONYEVI.D100的电机进行移动。这样,就需要双方共同遵守RS.232C通信协议H21和VISCA控制协议【431。RS.232C通信协议的作用就是让BF533和SONYEVI—D100之间可以进行通信,因为SONYEVI.D100只接收符合RS.232C通信协议规则的比特流信号。VISCA控制协议则是SONY公司自己开发的一个控制协议,其中规定了一系列的控制命令,如聚焦、旋转、倾斜等。这些命令是按照规定的格式制定的。因此,BF533要能控制SONYEVI.D100的电机进行移动,还必须使其发送的比特流满足VISCA控制协议规定的格式。这样SONYEVI.D100才能够识别通过RS.232C发送的比特流的含义,做出符合规定的一系列的操作。可见,RS.232C通信协议和VISCA控制协议在实验平台系统中是十分重要的。5.3.1SONYVISCA控制协议VISCA协议【431是SONY公司自己制定的控制协议。它用于视频系统控制结构中。通过该协议,可以利用计算机对摄像机进行远程控制,如聚焦、旋转、倾斜等。VISCA协议是单个网络上的设备协议,它是与平台无关的计算机控制协议。若使用VISCA协议则最多连接7台使用VISCA协议的设备,采用菊花链方式连接。这样通过一台计算机就可以同时对这7台设备进行控制。在VISCA控制协议中,输出命令的一边,比如电脑,被称作为控制器,而接收命令的一边,Lg如SONYEVI.D100P,被称作为设备端。VISCA控制协议符合RS.232C标准。因此,控制器与设备端可以通过RS.232C标准进行通信。在VISCA协议中,规定的RS.232C标准的参数如表5.1所示。表5.1VISCA协议中RS.232C标准的参数设置l参数设置波特率9600bps数据位8bit校验位无停止位1bit起始位lbitVISCA通信的最基本的单元称为分组,其结构如图5—6所示【431。南京邮电大学硕士研究生学位论文PacI‘9t《3t016一HeaderMessa99(1第五章基于BF533的自动聚焦算法的实验平台的实现b忡)bytes)一14—一ITennlnalorBy协1Byte2Byze3FF///‘SQndor's’’一一’一·....~..。~~.OBn3//‘/。~,,‘·:1Bit31Blt21Bn11BIt011IBit7产m。甲Bit6斟t5Bn4Receikr-saj口ress1Bit71Bit61Bn51Bit4B“2BnlBIt0(MSB)(LSB)iMSB){LSB)图5—6VISCA控制协议的分组结构可以看出,分组由三个部分组成:分组头、消息和终止符,分组的最大长度为16个字节,其中消息的最大长度为14个字节。分组头是分组的第一个字节,它由发送者的地址和接收者的地址组成,即控制器的地址和设备端的地址组成。这里可以发现,在VISCA中存在着地址的概念。VISCA规定,控制器的地址为0,设备端的地址从离控制器一端最近的设备端开始依次为1,2,3,....,7,最多只能连接7台设备端。地址的分配过程是在初始化摄像机时完成的。例如,若SONYEVI.D100被分配的地址为1,而控制端的地址的为0,则分组机的字节为81H。同理若SONYEVI—D100被分配的地址为2,则分组头的字节为82H。在控制协议中,若分组头为8X,则该命令即是对地址为x的设备端发送的。而设备端作为应答者发送应答消息时,其分组头的字节为YOH,其中Y为x+1。例如,SONYEVI—D100被分配的地址为1时,其应答消息的分组头的字节为90H。接着分组头后面就是消息,消息的长度不能超过14个字节。消息就是需要发送的命令。VISCA中的每个命令含有不同的含义。在控制过程中,通过发送符合VISCA中规定格式的命令,设备端就可以正确解析,从而做出想要的操作。例如命令“8XStandby,而命令“88300101040003FF”(X:设备端的地址)含义就是让设备端FF"含义就是控制器向设备端广播地址信息。分组最后就是终止符,它规定为FFH,表示整个分组传送完毕。当设备端收到该字符时,表示可以开始解析分组命令了。图5.7是通过VISCA控制协议进行自动聚焦时消息通信的部分流程举例。该图中的命令主要完成的功能是获得SONYEVI.D100的地址,然后让摄像机能够进行手动调焦,发送拉远镜头的命令(FAR)。同理,发送其它命令时可以按照图中命令一样处理。南京邮电大学硕J:研究生学位论文第五章基于BF533的自动聚焦算法的实验平台的实现88300iFF(广播地址)一一一一883002FF(地址为I)8101043803FF(手动调焦)一9041FF9051一810l0408FF(确认完成)02FF(FAR)一一904lFF905lFF(确认完成)图5.7消息通信的部分流程5.3.2RS一232C串口通信协议。在实验平台系统实现过程中,由于VSICA控制协议必须按照RS一232C通信协议进行传送,所以,需要对RS.232C标准【421要有一定的了解。RS.232C标准(协议)的全称是EIA.RS一232C标准,定义是“数据终端设备(DTE)和数据通讯设备(DCE)之间串行二进制数据交换接口技术标准"。RS.232C标准是美国EIA(电子工业联合会)与BELL等公司一起开发的1969年公布的通信协议。它适合于数据传输速率在0"--20000bit/s范围内的通信。这个标准对串行通信接口的有关问题,如信号线功能、电器特性都作了明确规定。由于RS.232C并未定义连接器的物理特性,因此出现了DB.25、DB.15和DB.9各种类型的连接器,其引脚的定义也各不相同。。在实验中主要使用了DB.9连接器。它只提供异步通信的9个信号,而这9个信号也是最常用的9个信号。在5.4节中,将对这9个信号进行介绍。RS.232C标准主要解决的是DCE与DTE之间的通信。当远距离通信(传输距离大于15m的通信)时,一般要加上调制解调器Modem;当通信距离较近时,可不需要Modem,通信双方可以直接连接,这种情况下,只需使用少数几根信号线。最简单的情况,在通信中根本不需要RS一232C的控制联络信号,只需三根线(发送线、接收线、信号地线)便可实现全双工异步串行通信。这种无Modem连接的通信方式正是实验平台所使用的。5.3.3BF533的UART通信在实验平台系统实现过程中,由于通过BF533发送控制信号来控制摄像机,这里就需堕塞堂皇奎兰堡主竺窒竺兰垡堡奎要使用到BF533的UARTl口[41。UART釜至皇墨主!!塑!塑皂垫鍪堡墨婆塑壅墼兰鱼堕壅墨121是一个与PC机的标准异步串121兼容的全双工外设。UART在串行和并行格式之间转换数据。串行通信遵循支持多种字长、停止位和奇偶校验的异步协议。UART也包括调制解调器控制和中断处理的硬件。‘UART遵循异步串行通信协议:●5~8位数据位;●1、1/2或2位的停止位;·无奇偶校验位、奇校验或偶校验;·波特率=SCLK/(16×分频系数),这里SCLK是系统时钟频率,分频系数可以是1-65536的任意值。图5.8为TX管脚上的一个典型的物理BIT流。数据位修止馋]:F]兰翌冈竺冈竺:厂,I,,——————————/\——————————、、\\声起始位低位校验位图5.8TX管脚上的BIT流UART是具有DMA功能的外设,支持独立的TX和RXDMA通道。它们能够用于任何DMA模式或者非DMA模式。在DMA模式下,独立的接收(IⅨ)DMA通道和发送(TX)DMA通道在UART和内存之间直接交换数据,而不需要处理器移动数据。在非DMA模式下,数据移入或移出UART有DSPI为核控制,需要采用中断或查询方式。在实验平台系统实现过程中,主要采用的是非DMA模式中的查询方式。在非DMA模式下,要发送一个数据,则需要写入到UAI玎x_THR寄存器,接收一个数据则需要读取UARTxRBR寄存器。为了防止数据的丢失和对准串行数据流,UARTx线路状态寄存器(UARTxLSR)提供用于握手的两个状态标志:THI冱和DR。当UARTxTHR准备好接收新的数据时THRE标志被置位,而当DSP写入新的数据到UARTxJHR寄存器后,该位被清除;当向~个已有数据I拘UARTx_THR寄存器写一个新的数据时,原有的数据将被覆盖。当UARTx_RBR寄存器中的新数据有效时,DR标志置位;当DSP将数据读走,该标志自动清除。读一个没有接收到新数据的UARTx_RBR寄存器时将返回前面接收到的数据。例如,若想将命令“883001FF"通过UARTH发送出去,则需将命令逐个字节的写多,.UARTx_THR寄存器中,UARTx_THR寄存器每收到一个字节就会将其发送出去,同时将THRE标志清除,一旦检测到1rI{ER标志清除时,就可以接着发送下南京邮电大学硕士研究生学位论文第五章基于BF533的自动聚焦算法的实验平台的实现一个字节。5.4实验平台的接口连接图在实验平台系统设计过程中一共使用到了两种端V1,一种是VISCA端口,如图5-9(a)所示;另一种是DB9端口,如图5—9(b)所示。这两种端口的各引脚的含义如表5—2(a)、5—2(b)所示。5图5.9(a)VISCA接口图5.9(b)DB9端口表5-2(a)VISCA接口中各引脚定义引脚12信号名称数据终端就绪数据设备就绪发送数据信号地接收数据信号地IR控制无连接简称DTRDSRTXDGNDRXDGNDIROUTN.C.信号功能数据终端准备就绪数据设备准备就绪发送数据公共信号地接收数据公共信号地IR控制信号无连接345‘678表5-2(b)DB9接口中各引脚定义引脚12信号名称载波检测接收数据发送数据数据终端就绪信号地数据设备就绪请求发送清除发送振铃指示简称DCDRXDTXDDTRSGDSRRTSCTSRI信号功能数据链路已连接接收数据发送数据数据终端准备就绪公共信号地数据设备准备就绪请求发送切换到接收模式远程呼叫3456789在BF533上的UARTH是DB9的连接器,而在SONYEVI—D100上的是VISCAH。只有将这两个端口连接才能进行通信及控制。在SONYEVI.D10007要通过VISCAIZI进行控制,需要用N5个信号,与此相对应的,DB9也必须用到相应的5个信号。在连接时,需进行交叉.53.塑室墅皇奎兰堡主堡窒竺兰垡堡奎塑至重量王墅墅!塑旦垫鍪堡兰鲨塑塞墼兰鱼塑塞翌连接,即一端的TXD与另一端的RXD相连,而一端的RXD则与另一端的TXD相连。否则,如果进行顺序连接的话,则两端的TXD相连及两端的RXI)相连,就不能进行信号发送了。因此,两个端口的连接图如图5.10所示。SONYEVI.D100的VISCAU!BF533的UARTI二11.DTR1.DCD2.DSR2.RxD3.TXD3.TXD4.GND4.DTR5.RXD5.SG6.DSR7.RTS8.CTS9.Iu图5.10VISCAVi与UARTI]的连接图5.5实验流程及结果分析实验平台系统的设计过程分为两个步骤:将自动聚焦的程序移植到DSP中、实现BF533与SONYEVI.D100通信。而在实现BF533与SONYEVI.D100通信过程中又分为三个小步骤:PC机与SONYEVI.D100通信、BF533与PC机通信、BF533与SONYEVI.D100通信,达到用BF533来控制SONYEVI.D100的目的。最后用该平台系统进行自动聚焦的实验。5.5.1实验流程在实验过程中,首先将自动聚焦的程序写入BF533中,它是整个系统的核心部分。然后,实现BF533与SONYEVI.D100通信。而在实现BF533与SONYEVI.D100通信过程中又分为三个小步骤:PC机与SONYEVI.D100通信、BF533与PC机通信、BF533与SONYEVI.D100通信。通过这三个小步骤来最终达到用BF533来控制SONYEVI。D100的目的。实现流程如图5.11所示。南京邮电大学硕士研究生学位论文计算机第五章基于BF533的自动聚焦算法的实验平台的实现BF533③SONYD100图5.11实现流程图1.PC机与SONYEVI.D100通信PC机与BF533有所不同,一个是微机,另一个是DSP。在微机上已经有很多现成的串口控制软件,比如串口调试器等,而这些串口调试器操作起来很简单。因此,在实验平台设计的第一步就是实现PC机与SONYEVI.D100通信,确保按照VISCA控制协议输入命令时,能够控制摄像机。在实验中采用串口调试器2。0软件进行操作的。在PC机上运行串口调试器并输入命令,摄像机按照命令进行操作,则说明PC机与SONYEVI.D100通信成功。2.BF533与PC机通信在PC机与SONYEVI.D100通信成功后,开始实现BF533与PC机通信。这一步骤主要是调通BF533的UARTVI串口通信程序。在BF533一端通过UARTI=l发送和接收字节,在PC机一端,则用超级终端程序来发送和接收字节。若二者能够通信时,BF533能够发送字节至PC机上,且在超级终端上显示出发送的字节;同时,BF533也能够接收来自PC机上发送的字节,且从UARTxRBR寄存器中可以读取字节。3.BF533与SONYEVI.D100通信当PC机与SONYEVI.D100通信成功且BF533与PC机通信也成功后,证明BF533与SONYSONYEVI.D100通信具有可行性。在实验过程中,需要注意串口连接线的接法。PC机与EVI.D100能够通信说明PC机是DTE而SONYEVI.D100是DCE。同理,BF533与PC机能够通信说明PC机是DTE而BF533是DCE。这说明,BF533与SONYEVI.D100进行通信,就是两个DCE之间进行通信。因此,若想两个DCE之间进行通信必须用交叉线相连,如图5.10所示,这样才能一方发送,一方接收。在使用交叉线连接后,运行由第二步骤实现的UART口的串口通信程序,按照VISCA控制协议规定的命令格式,即可相互通信。完成这两个步骤后,整个实验平台系统的设计工作就完成了。5.5.2实验结果按照上面的实验步骤,论文对所提的自动聚焦算法进行了验证。在实验过程中,做了多组图像的聚焦实验,这里只列举一组实验结果,具体的图像见图5.12,其中图5.12(a)要里!苎主里堕!壁!竺蔓些盟兰堕!鱼塑兰翌和(b)是离焦图像,图5一12(c)是聚焦图像。在这组图像巾一共采集了7帧,园为采集到的图像只取单场,所以大d,为360x288。每帧的清晰度评价函数值见表5—3。图5.13为根据堕皇业皇歪兰堡±![塾兰兰些堡兰清晰度评价函数值画出的清晰度评价函数曲线。鬣罄、麓懑萋羲’(a)离焦幽像b)离焦幽像(c)聚焦倒像圈5.12实验图像表5-3实验图像的清晰皮评价函数值帧号7清晰度评价函数值】3831453女%目*¥~”日m*m《*"自#自&日《日£%MH5I3实验幽像序列的清晰度评价函数曲线塑室塑皇奎兰堡主婴壅竺兰垡笙奎兰至兰茎王!暨!!竺鱼垫壅堡墨望竺壅垦兰鱼堕茎翌从表5.3可以看出,第5帧的清晰度评价函数最大,而此时对应的图像即为聚焦图像。但是从图5.13中可以看出,清晰度评价函数曲线并没有呈现完美的单调性,而是出现了毛刺。不过,这些毛刺的清晰度评价函数值均小于聚焦图像的清晰度评价函数值,因此,在采用全局搜索算法时还是能够准确定位到聚焦图像的。可见,所提自动聚焦算法具有一定的有效性。但是,论文通过做大量实验发现,该算法并不是每次均有效的。有时候并不能准确聚焦到聚焦图像,而是会产生偏差。这主要是由于采用的是基于Sobel算子的清晰度评价函数,其聚焦性能和其所取的阈值大小有关。如果阈值取值不变,而每次被摄图像均不一样,则该阈值不可能适应所有被摄图像,所以必然会产生偏差。这是该算法的一个明显的缺点。但是一旦选对阈值,该算法就能对被摄图像准确而迅速的聚焦。5.6本章小结在这一章中,论文主要是进行了自动聚焦系统的实验平台的设计。实验平台的实现系统分为软件部分和硬件部分。软件部分主要是指自动聚焦的算法和图像的采集。自动聚焦的算法主要包括清晰度评价函数和寻优搜索算法。实验平台中选用的清晰度评价函数是基于Sobel算子的清晰度评价函数,而寻优搜索算法选用的是全局搜索算法。实验平台的硬件部分包括:一台SONYEVI.D100摄像机、一块BF533开发板、一根VISCA控制线、一根串口交叉线,一根串口顺连线和一台监视器。将这两部分结合起来,构成了整个实验平台的系统。整个实验平台完成的功能是通过BF533对SONYEVI.D100摄像机进行自动聚焦控制。在控制过程中,需要用到两种协议VISCA控制协议和RS.232C通信协议。其中VISCA控制协议是规定了操作摄像机的各种命令的格式,而RS.232C通信协议是用来实现BF533通过UART口和SONYEVI.D100进行通信。整个实验平台的设计流程分为两个步骤,首先,将自动聚焦的程序移植至IJBF533中,它是整个系统的核心的部分,然后,实现BF533与SONYEVI.Di00通信。其中,在实现BF533与SONYEVI.D100通信过程中又分为三个小步骤:PC机与SONYEVI.D100通信、BF533与PC机通信、BF533与SONYEVI.D100通信。从而,最终达到用BF533来控制SONYEVI—D100进行自动聚焦的目的。从实验效果来看,该自动聚焦的实验平台具有一定的可操作性,能够完成一定场景下的聚焦功能。南京邮电大学硕士研究生学位论文第六章总结与展望第六章总结与展望近年来,随着人们生活水平的日益提高,数码产品也逐渐地步入每个家庭。作为数码相机和数码摄像机的一项关键功能,自动聚焦技术正越来越受到众厂家和国内外学者的重视。论文为了更好的研究自动聚焦算法,对自动聚焦的情况进行了划分,主要分为两种情况:一种是长物距,即不同物体的物距均远大于焦距的情况;另一种是不同物体的物距不是全都远大于焦距的情况,称之为长短物距。目前,大部分的关于自动聚焦的研究论文主要围绕长物距情况下的自动聚焦算法,而对于长短物距下的自动聚焦问题则涉及较。所以,本论文主要是针对长短物距情况下的自动聚焦算法进行了研究,提出了基于Sobel算子的清晰度评价函数和基于中心分块加权DCT的清晰度评价函数两种算法,并进行了实验平台的设计。论文主要完成的工作包括以下几个方面:1.根据自动聚焦的情况不同,提出了长物距和长短物距的概念。分析了图像清晰度评价函数应满足无偏性好、灵敏性高、信噪比高的特点。并重点研究了在长物距和长短物距下自动聚焦时得到的清晰度评价函数的峰值性问题。研究发现清晰度评价函数并不是大部分论文所认为的应满足单峰性。只有在长物距下的清晰度评价函数满足单峰性,而在长短物距下的清晰度评价函数则满足多峰性。2.根据长短物距下的清晰度评价函数的特性,从边缘检测的角度出发,论文提出了‘基于Sobel算子的清晰度评价函数。并将其与Roberts算子、LaplacianofGaussian算子进行了比较,发现该算子在长短物距情况下作为清晰度评价函数更加合适。另外,论文还对基于Sobel算子的清晰度评价函数阈值问题进行的讨论。3.根据长短物距下的清晰度评价函数的特性,从计算高频分量含量的角度出发,论文提出了基于中心分块加权DCT的清晰度评价函数。该方法通过采用中心分块的方法突出了中心区域的图像的重要性,并且考虑了局部高频分量的变化。此外,又通过加权函数‘来赋予每个分块不同的权重,从而突出目标的高频分量变化幅度,有效避免误判。为了说明所提方法的有效性,还与传统高频分量方法进行了比较。4.基于Sobel算子的清晰度评价函数和基于中心分块加权DCT的清晰度评价函数这两种方法进行了比较。经研究发现在聚焦准确性方面,基于中心分块加权DCT的清晰度评价函数要优于基于Sobel算子的清晰度评价函数,但是基于Sobel算子的清晰度评价函数的复杂度和计算量要明显小于基于中心分块加权DCT的清晰度评价函数。南京邮电大学硕士研究生学位论文第六章总结与展望5.设计了自动聚焦实验平台,对所提算法进行了验证。实验平台是基于BF533完成的。它完成的功能是:按照RS.232C串口通信协议以及SONYVISCA控制协议,通过BF533的UART口对SONYEVI.D100摄像机进行聚焦控制。平台的清晰度评价函数采用的是基于Sobel算子的清晰度评价函数,而寻优搜索算法采用的全局搜索算法。当然,尽管本文做了上述的工作,但是仍有许多不足之处,为了达到真正实用和性能优良的目标,需要在以下几个方面进行改进:1.基于Sobel算子的清晰度评价函数虽然计算量小、复杂度低,但是由于阈值问题,有时会影响聚焦判断的正确性。怎样找出阈值与图像的之间的关系是有待解决的一个问题。2.基于中心分块加权DCT的清晰度评价函数虽然聚焦正确性比较高,但是其计算量大,不能适用于实用情况。如何降低计算的复杂度,使其能够用于实际情况,也是一个突破点。3.提出上述两种方法的前提是,假设被摄物体的目标图像处于取景框的中心位置。也就是说,当被摄物体的目标图像处于取景框的中心位置时,这两种方法才有效,否则不一定有效。而论文没有对被拍摄的目标图像不在取景框中心的情况进行讨论,这是今后需要全面考虑的地方。4.在设计自动聚焦系统的平台时,采用的是摄像机而不是数码相机。数码相机的光学变焦要比摄像机短,因此严格意义上来说,二者还是有所区别的。由于本人的经验和能力有限,论文中难免会有一些错误,恳请各位老师和同学予以指正和谅解。南京邮电大学硕士研究生学位论文参考文献参考文献[1】贾志科,崔惠娟,唐昆彩色数字照相机的设计[J].电视技术,2000,221:15—16.[2】甘泉.摄影科学与技术摄影[M].北京:北京理工大学出版社,1998.【3】ToshinobuHaruki,KenichiConsumerKikuchi.VideocamerasystemusingfuzzyLogic[J].IEEETransactionsonElectronics,A峙1992,38(3):624-631.【4】陈峰.Blackfin系列DSP原理与系统设计[M].北京:电子工业出版社,2004.【5】石顺祥,张海兴,刘劲松.物理光学与应用光学[M].西安:西安电子科技大学出版社,2000.【6】6康宗明,张利,谢攀.一种基于能量和熵的自动聚焦算法[J].电子学报,2003,31(4):552—555.BYUNG—DEOKetal。Implementationofa【7】LEE厄一HO,KIMKUN-soP,NAMpassiveautomaticfocusingalgorithmfordigitalstillcamera[J].IEEETransactions449.454.newsensefordepthofonConsumerElectronics,1995,41(3):【8】A.Pentland.A9(4):523-531.Field【J】.IEEETrans.PattemAnalysisandMachineIntel,1987,[9】MuraliSubbarao,TaeChoi,ArmanNikzad.Focusingtechniques[J].Optical32(11):2824-2836.【10】MuraliSubbarao,Jenn-Kweidepth—from—focus【J】.IEEE20(8):864—882.【11】J.KOilEngineering,1993,Tyan.SelectingTransactionstheoptimalfocusmeasureforAnalysisautofocusing硼OilPatternandMachineIntelligence,1998,Tyan.AnalysisapplicationofautofocusingandTree-Dimensionalshaperecoverytechniquesbasedatimagefocusanddefocus.PhDthesis,Dept.ofElectricalEng.,SUNYimageStonyBrook,1997.UniversityPress,2003.【12】CASTLEMANKENNETHR.Digitalprocessing【M】.Beijing:Tsinghua【13】李奇,冯华君,徐之海,等.自动对焦系统中图像非均匀采样的实验研究[J].光子学报,2003,32(12):1499-1501.【14】曹茂永,孙农亮,郁道银.基于灰度梯度的数字图像评价函数[J].光电工程,2003;30(4):69—72.【15】A.W.Lohmman,D.Mendlovic,Z.Zalevsky.A1997,37:7204—7209.digitalmethodformeasuringthefocuserror[J].Appl.,【16】高赞,姜威,朱孔风,等.基-TRoberts梯度的自动聚焦算法[J].红外与激光工程,2006,35(1):117—121.【17】高赞,姜威,朱孔凤,等.基于边缘梯度的自动聚焦算法[J].系统工程与电子技术,2007,29(3):南京邮电大学硕士研究生学位论文495—498.参考文献【18】周贤,姜威.基于图像边缘能量的自动聚焦算法[J].光学技术,2006,32(2):213—218.【19】Chun-HungShen,HomerH.Chen.RobustInternationalConferenceonfocusmeasureforLow—Contrastimages[C].The14thComputersinEducation,ChinaBeijing,2006,Jan7—11:69—70.withadaptivestepsize【20】JieH,RrongZZ,ZhiLH.ModifiedfastclimbingsearchautofocusalgorithmConsumersearchingtechniquefordigital-262.camera川.IEEETransactionsonElectronics,2003,49(2):257【2l】朱铮涛,黎绍发,陈华平.基于图像熵的自动聚焦函数研究[J].光学精密工程,2004,12(5):537—542.【22】李文恩,陈海清,李俊,等.红外导引头成像光斑图像处理及自动聚焦[J].量子电子学报,2003,20(3):364-370.【23】J.Baina,J.Dublet.Automaticfocusandiriscontrolforvideocameras[C].FifthInternationalCon£onImageProcessinganditsApplications,July1995:232-235.【24】S.Y.Lee,S.S.Park,C.S.Kim,Y.Kumar,S.W.Kim.Low-powerDCTforthemobileautofocusalgorithmusingmodifiedComputersinEducation,Chinaphones【C】.The14thInternationalConferenceonBeijing,2006,Jan【25】Quan7-11:67—68.methodbasedthecenterblockingFeng,KeHan,Xiu-changZhu.Anewauto—focusingonDCT[C].FourthInternationalConferenceonImageandGraphics,Aug.2007:32-38.[26】任四刚,.李见为,谢利利.基于灰度差分法的自动调焦技术[J].光电工程,2003,30(2):53-55.【27】LiFeng,JinHong.AfastautofocusingmethodfordigitalstillOilcamera[C】.ProceedingsoftheFourthInternationalConference5001-5005.MachineLearningandCybernetics,ChinaGuangzhou,Aug.200518—21:【28】韩科,朱秀昌,冯荃.不同物距下的自动聚焦方法研究[J].南京邮电大学学报,2007,27(6):44-48.【29】ROBERTSLG.Machineperceptionofthree—dimensionalsolids,OpticalandElectro—OpticalInformationProcessing[M].Cambridge:MITPress,1965:157—197.【30】苟中魁,张少军,李忠富,等.一种基于极值的自适应中值滤波算法[J].红外与激光工程,2005,34(1):98—101.【31】王立强,林斌,徐向东,等.基于USB32—34.VideoCamera的自动对焦系统[J].光电工程,2001,28(5):【32】孙杰,袁跃辉,王传永.数字图像处理自动图像聚焦算法的分析和比较[J].光学学报,2007,27(1):35—39.-6I一南京邮电大学硕士研究生学位论文参考文献【33】杨淑莹.VC++图像处理程序设计[M].北京:清华大学出版社,2005.【34】FengQuan,HanKe,ZhuXiu-chang.Anauto—focusingmethodfordifferentobjectdistancesituation[J].InternationalJournalofComputerScienceandNetworkSecurity,2007,7(6):31—35.[35】高赞,姜威,朱孔风.基于最大梯度和阈值的自动聚焦算法[J].电子测量与仪器学报,2007,21(5):49—54.【36】谢攀,张利,康宗明,等.一种基于尺度变化的DCT自动聚焦算法[J】.清华大学学报(自然科学版),2003,43(1):55-58.【37】赵秋玲,赵建森,蒋永华.改进DCT的自动聚焦算法[J].中国图象图形学报,2007,12(7):1026—1028。【38】吴振锋,左洪福,邱根良,等.显微镜一种新的自动聚焦算法[J].数据采集与处理,2000,15(3):35l一354.[39】李美志.摄像机的自动聚焦方式及克服存在问题的方法[J].电视技术,1994,10:6-9.[40】WolfgangKesseler,JanFischer.AnalyticalmodelofautofocussystemswithCCDcamera.OpticalEngineering,1998,37:369—375.【41】王风宇,王睿,张广军.基于DSP的自动聚焦系统.光电工程,2007,34(8):134-138.【42】李建华,郭明.RS一232和调制解调器高级通信编程[M].北京:人民邮电出版社,2006.【43]SONYEVI-DIOO/DIOOPcameraTechnicalManual.-62—南京邮电大学硕士研究生学位论文致谢致谢三年的研究生学习生活即将结束。在这三年中,我不仅学到了专业知识、提高了科研能力,而且丰富了人生阅历,得到了老N{1"3朋友们的许多关爱。这三年,是忙碌充实的三年,也是人生道路上难以忘怀的三年。我的导师朱秀昌教授,专业知识渊博,学术成果丰硕,治学态度严谨,待人和蔼可亲。他不仅在学业上对我给予了全方位的精心指导、倾注了大量的心血,而且在生活上给予了无微不至的关心和帮助,使我在三年的研究生学习生活期间受益匪浅,这也将对我今后的学习、工作和生活产生潜移默化的影响。在此,我要对我的导师表示深深的谢意。图像处理与图像通信实验室的老师们,在我学习理论知识和参与科研实践活动中,给予了悉心的指导和许多有益的帮助。在即将离别之际,也要对他们说一声谢谢。我和我的同门沈寒、诸雯、吴坤、李小娟、王凯、金郭簧、莫启敏和赵爱峰同学,在学习上相互帮助,在生活上相互关心。另外,还要特别感谢王凯、诸雯、莫启敏及沈林林同学在调试系统时给我提供了很大的帮助。同时也要感谢我的舍友高小云同学给予了我鼓励和帮助。最后我还要感谢陪伴我度过南邮三年学习生活的同学们、朋友们,以及曾经帮助和支持过我的每一位老师和同学。最后,特别感谢我的父母,感谢他们对我学习时及找工作时的支持。他们无论何时都是我的坚强后盾,是我前进的动力,我要由衷的感谢他们。冯荃2007年4月3日南京邮电大学硕士研究生学位论文发表的论文、参加的科研工作和申请的发明专利及获奖情况发表的论文、参加的科研工作和申请的发明专利及获奖情况发表的论文:[1】FengQuan,HanKe,ZhuXiu-chang.Anauto-focusingmethodfordifferentJournalofComputerScienceandNetworkobjectdistancesituation阴.Intemational31—35.Security,2007,7(6):[2】QuanFeng,KeHan,Xiu-changblockingZhu.Anewauto-focusingmethodbasedConferenceononthecenterDCT[C].FourthInternationalImageandGraphics,Aug.2007:32-38.[3】韩柯,冯荃,朱秀昌.基于二维加权主元分析的人脸识别研究[J】.信息技术与信息化,2006,(6):82.84.[4】韩柯,朱秀昌,冯荃.基于二维DCT与Elman神经网络相结合的人脸识别研究[e1.第十三届全国图象图形学学术会议论文集,中国南京,2006年11月6日一8日:373-376[5】HanKe,FengQuan,ZhuXiu—chang,WangonHui-yuan.Anewfacerecognitionmethodbased2DWPCA[C】.ProceedingsofEighthACISInternationalConferenceonSoftwareEngineering,ArtificialIntelligence,Networking,andJuly30一AugustParallel/DistributedComputing,China,Qingdao,200707411,V01.1:196-199.(EIAccessionnumber:10862376)[6】韩科,朱秀昌,冯荃.不同物距下的自动聚焦方法研究[J].南京邮电大学学报,2007,27(6):44-48.(EI检索号:080811111226).参加的科研工作:在本图像实验室和南京天朗电子公司合作的有关“电子自动聚焦的图像处理方法"(2004外09项目的补充协议)研究工作中,负责其中聚焦算法和实验平台的设计和实现。申请的发明专利:[1】韩柯,朱秀昌,刘峰,胡栋,冯荃,.朱轶凡,干宗良.数码相机中自适应自动聚焦方法.专利号:ZL200610088321.7(进入公示阶段)获奖情况2005--2006年:获得南京邮电大学“优秀研究生"称号。2006--2007年:获得南京邮电大学“优秀研究生”称号。-I_____--_______l___-I___________--____-●_____-_-___________________________--__-_________-________●。。-。。。。。’————————————————一。宣室塑皇奎堂堡主里窒生兰垡笙奎堕茎附录1、自动聚焦程序的主流程图.65-lElU^学坝}1Ⅲ究生学位论Zmi实验平台实况照片实验中拍摄的图像序列“Computer”Iq像序列芋列图像其有16帧罔像,这罩仪列出具有。t表性的几帧图像第5帧刳像(聚焦幽像第1帧图像(离焦幽像“Clock”I墨|像序列事列图像共有34帧图像,这里仪列出具有代表性的几帧图像数码相机的自动聚焦方法的研究与实现

作者:

学位授予单位:

冯荃

南京邮电大学

1.期刊论文 陈敏.刘珺.孔令占.CHEN Min.LIU Jun.KONG Ling-zhan 论数码相机成像品质及其对医学摄影的影响 -信息记录材料2007,8(6)

客观地介绍了影响数码相机成像品质的几个相关因素.针对数码相机成像对医学摄影实际工作的不利方面,给予了指导性的应对技巧.

2.期刊论文 张艳萍 数码相机成像体系浅谈 -今日印刷2003,\"\"(5)

数码相机也叫数字式相机.它是集光学、机械、电子技术于一体的产品,它集成了影像信息的转换、存储和传输等部件,具有数字化存取模式、与电脑交互处理和实时拍摄等特点.随着数字技术的迅猛发展,数码相机的性能不断完善,其效果不仅被普通使用者所接受,就连专业摄影人士也对其产生了浓厚的兴趣.

3.期刊论文 王思丽.戴玉刚.周登.马刚.苏兴 基于双目视觉的数码相机定位方法研究 -长春工程学院学报(自然科学版)2009,10(2)

围绕数码相机定位问题,在合理假设的基础上,首先建立像素、图像、光心、世界4坐标系并推导出坐标转换公式,进而确定相机成像的线性几何模型.其次利用MATLAB读图、确定椭圆形区域和边界点除噪等预处理,最终完成靶标上圆心的确定和相机内部参数的确定,并以共线性的误差来衡量模型求解的精度.

4.期刊论文 刘鹏.王鉴.霍富功.师蒙蒙 基于数码相机的大型物体测量方法研究 -电子测试2010,\"\"(10)

工业生产中,常常需要对某些物体的几何参数进行检查、测量,以检查是否满足质量要求.本文提出了一种利用数码相机测量大型物体几何尺寸的方法.介绍了测量原理、相机成像模型、标定原理以及畸变情况,通过直接线性变换(DLT)标定相机内部参数,结合透镜成像的知识,对采集到的序列图像进行测量,计算出建筑的宽度和高度.实验证明,该方法能够克服传统测量方式的缺点,并且获得较为准确的结果,满足工业测量的要求.

5.期刊论文 李书义.LI Shu-yi 数码相机与传统相机的景深关系 -科技情报开发与经济2006,16(10)

在介绍照相机景深公式的基础上,讨论了在什么情况下数码相机与传统135相机成像效果相同,推出了二者景深相同的条件,并给出了在远摄和近摄时二者的景深变换关系.

6.期刊论文 韩春雷.王库.马健 一种数码相机成像和视频处理前端的设计 -单片机与嵌入式系统应用2004,\"\"(9)

针对数码相机的成像和视频处理前端,给出一种基于TI DSP技术的设计方案.详细介绍单芯片数字视频解码器TVP5040和单芯片影像处理器TMS320DSC系列DSP的图像功能单元CCD控制器的功能和特点,并给出二者的硬件连接和软件实现方法.

7.期刊论文 刘解放.侯振雨 数码相机定位模型研究 -河南科技学院学报(自然科学版)2010,38(3)

针对相机标定问题设计了一个非线性优化模型,利用最小二乘原理检验了模型的精度和稳定性,最后建立超定方程确定了两相机之间的相对位置.模型充分考虑了相机成像中得诸多因素,结合其中的线性和非线性关系.建立了非线性优化模型.数值结果表明,模型合理,具有广泛的适用性.

8.期刊论文 姜大志.孙闵.刘淼.姜梅.丁秋林.Jiang Dazhi.Sun Min.Liu Miao.Jiang Mei.Ding Qiulin 数码相机标定方法研究 -南京航空航天大学学报2001,33(1)

数码相机在计算机视觉中的应用逐渐普及和深入,在应用中数码相机的标定是相当重要的。根据数码相机的特点,提出了一种新的标定方法。针对数码相机的某一状态,先确定其内部参数矩阵,再通过采集的图像求出外部参数矩阵。首先建立了相机成像的几何模型,并将此模型分解成内、外参数矩阵。文中详细介绍了数码相机内部参数矩阵中的各元素所对应的物理参数以及求解它们的原理和方法,从而建立内部参数矩阵。推导了求解外部参数矩阵的计算公式,并且介绍了相应的求解方法,再由外部参数矩阵求解出对应的物理参数。通过实验表明这种方法有相当高的精度,且操作方便。

9.期刊论文 文珑银.邹翔.独大为 数码相机标定的新方法 -科协论坛(下半月)2009,\"\"(7)

本文针对现实中广泛应用与研究的数码相机定位问题,基于数码相机成像原理提出了一种\"随机搜索匹配\"的标定新方法.根据计算出的标靶任意物点与其对应像点的坐标转换公式,确定物平面标靶圆周上的物点与像平面标靶所成像边缘点的对应关系,进一步运用随机搜索得到标靶圆心坐标.考虑成像产生的径向失真(畸变),矫正巳求得标靶圆心坐标,从而确定标靶圆心准确位置.实验结果表明,该定位方法操作简单,精度较高,可应用于各种空问目标定位测量.

10.学位论文 虞紫英 服装样片照相图像识别及复原技术研究 2007

照相输入法,即数码相机对服装样片的照相输入方法是样片输入方法发展的新方向。目前国内服装领域研究照相输入法为数不多,且大都局限于本学科领域;而计算机视觉虽对图像畸变研究甚广,但针对性不强。由于数码相机本身工艺上的影响,拍摄图像造成一定的非线性畸变,这也是本课题所要解决的主要问题。本课题结合了服装学科和计算机技术,在分析相机成像原理及标定技术的基础上,提出用标准网格图作标定图像,并用二次多项式为回归函数建立畸变校正模型,达到了0.3%的精度,进一步完善服装CAD技术。

首先,课题的第一步是探讨分析照相成像原理和计算机视觉技术,并确定本课题研究方案。数码相机成像遵循小孔成像原理,它的成像涉及到四个坐标系:将世界坐标系中的信息(如空间点P)转换到光心坐标系,再映射到图像坐标系,最后转换到像素坐标系。但由于光学镜头实际制造、安装引起的差异,造成了照相图像非线性畸变,一般以径向畸变为主。对于畸变图像上点的位置关系描述,主要靠相机的标定来实现。本课题实行自标定方法,用标准网格图作标定,并建立畸变校正方法:分量计算法和极半径计算法。求解校正模型,进行一定约束条件的拍摄实验,实验步骤为:图像拍摄、中心核准、数据采集、系数回归及模型确定。

其次,在用标定网格做实验的基础上,求得畸变校正模型并进行精度分析。该标定图像的规格采用100mm×60mm,通过固定相机对其进行定焦、定距、镜头中心对齐物像中心以及相机平面平行物像平面的拍摄,采集大量的点坐标数据。对于图像中心区域进行核准,选取最佳图像。利用MATLAB对这些点进行多项式回归,并用最小二乘法估计参数。对得到的两个数学模型,通过比较计算量、计算稳定性及精度要求来确定最佳模型。由于极半径计算法得到的数据结果稳定,且相对误差控制在0.3%左右,则将其得到的模型作为本课题的畸变校正模型。R=Rd+△Rd=0.0003R2d+0.9773Rd+0.98Rd=√X2d+Y2d最后,在获得了畸变图像校正模型之后,用VC++程序语言实现软件对于样片图像文件的畸变校正。该软件包括图像处理的三方面:图像预处理、图像中心区域核准及畸变图像校正。图像预处理包括了去色、去噪、二值化和边缘检测处理,这是对源图像的前期处理,为了得到更清晰的目标图像,以便下一步的操作。以图像中心为圆心、图像对角线0.1倍长为直径的区域是中心不变区域,对该区域内的点不进行畸变校正,而对该区域外的点用畸变校正公式校正坐标值,进行图像重建。计算机实践结果表明,该软件的实际效果基本符合要求。

总之,本课题校正了服装样片图像的非线性畸变,将计算机视觉、相机标定技术与服装CAD技术相互结合在同一个平台上,实现CAD样片照相输入法的功能,从而改善数字化仪输入法的诸多不足,极大提高服装CAD技术的发展。

本文链接:http://d.g.wanfangdata.com.cn/Thesis_Y1411198.aspx

授权使用:国网电力高压研究所(gys),授权号:1462f383-e2ae-4f61-8522-9e460158c350

下载时间:2010年12月8日

因篇幅问题不能全部显示,请点此查看更多更全内容