您的当前位置:首页正文

矢量量化在话音编码中的应用

2021-11-23 来源:好走旅游网
’矢量量化在话音编码中的应用杨有为胡征【提要1矢量量化是一种高效的数据压缩技术。本文在扼要介绍矢量量化的定义与简单工作原理的基础上,着重讨论码书设计的几个关键间题。文中还介绍了一个采用矢量t化技术的话音编码器的硬件实现方法。一、引言矢量量化(vceto;O“a)l以Qzti。的是近几年来兴起的一种高效的数据压缩技术,是标量量化(sea乙arQuanri:azio;z)的自然发展量化就是将抽样序列{x(.)}的幅度,按一定规律进行“分级”或`分层”的意思也就是把整个抽样的幅度范围划分成一组有限个幅度区间{△、(.)(}如图l所示)这一个个区间称为量化区间。对落入某个量化区间内的所有样值赋予一个相同的幅度值(x。),此值称为量化值这种以一个个单独抽样值、。)(。一。,l2…卜二}为基础,通过合理划分量化区间{△x.)}和选择适当的量化值王x.,},达到失真最小的量化称为标量量化〔1〕.如果把样值序列{x`.,}中每K个相继样点构成一个K维矢量X,则以输入矢量X为基础通过合理划分区间选择合适的量化矢量Y,使其失真最小的量化方式就称为矢量量化〔23。图2为4维矢量的形成示意图其中伙:}为输入抽样序列取K=4,即每4个样点构成一个矢量这就得到了n/4个4维矢量盆卜户冉_._一、x肠图1标量纽化的盈化区间与量化值图24维矢t的形成示意图下面举一个K=2的例子来说明矢量量化是怎样进行的取K=2,便可得到一些2维矢量如果把2维矢量量化为(p,p:),所有可能的2维矢量就是一个2维欧氏空间,也就是所有可能的(p,p:)形成了一个平面矢量量化就是把这个平面划分成N块,更一般地说,划分成N个胞腔(cel)。根据一定的算法得到每一个胞腔的代表值,这样就可以构成一个具有N个胞腔的2维矢量量化器。图3为具有18个胞腔(即N=81)的2维矢量量化的概念图。分别选出Y:,YZ…Y,。18个代表值,形成一个有18个胞腔的2维矢量量化器.若一个要量化的输入矢量为A=(a:,a:),根据最小失真原则,分别计算以Y`(水二1,2,……,15)代替A时所带来的失真,其中最小失真值所对应的Y式i为玄中某一个值),沈是A的量化矢量(即重构矢量)。通常把所有N个重构矢量的集合称为码书(cod叻o劝.上例中,码书为c=币Y,Y:,…Y’j·Y、。}.码书中的每个矢量Y`称为码字c(odowroa)成码·国家自然基金资助的课题)氛矗、生俞夕川节码从、共…冯石,书`2、卜、失量计算Mj认)沐盆以二心毛:nd`义·几》Y1宫退查表止二少飞旦Y毛尸(毛)二、、才气【绝扁石与)(下伞五与)图318个胞腔2维矢量量化器概念示意图图4矢量量化系统框图。矢(亡叼`RKVteoc;)不同的划分。不同的量化矢量的选取就构成了不同的矢量量化器K我们可以把矢量量化写成一个简单的定义即〔二Y映射为另一个x维量化矢量Y罗=谧;,:矢量量化是把一个…Y,维模拟矢嫩X〔犷C::YZ}Y`。R。K}即Y二Q其中,劣称〔为信源空间R忿RK称为K维欧氏空间二{l`;卿、称为输出空间或码书。矢量量化系统通常可写成两个映射的乘积即必二。夕编码器a是将输入矢量x。了c东映映射为信道符号集J*,2…玄…N}中的一个元玄译码器刀是将信道符号、射为码书中的一个码字Y权平方失真测度测度,、为了导出量化器的设计方法人还要引入失真测度常用的失真测度有平方失真测度。加最大失真测度和似然失真测度等〔“〕在话音编码中x通常采用平方失真即d(x,Y)二万£(1(x`一,`)’。其中与y分别是矢量rx``与RY的分量矢量量化器的设e计一般是用最小失真的方法一最近邻近法(NaasetNieg杠berleu)来进行的”即(x)二I,一式中书(l,v4j“,{一…卜2>d(x,Y二`)《,d(x丫,)N}符号<图所示是一个矢量量化系统的方框图其简单工作过程是一>表示“当且仅当:(即充分必要条件)在编码端输入矢量然后。x与码、中的每一个或部分码字进行比较分别计算出它们的失真搜索出失真最小的在译码端2那个码字Y`并将它的序号2`玄(或它在码书中的地址)传送到译码端去。根据序号忿从码书()中查到相应的码字矶`由于收发两端的码书(码书xl与码书)完全一样所以失真最小的码字Y便是输入矢量的重构矢量i,。应注意的是,矢量量化系统在实际信道中传输的不是矢量Y本身而是它的序号所以传输速率是很低的二、中速率话音编码中矢量量化系统的设计话音编码可以分成波形编码与参数编码两类因此形成输入矢量时也有两种方式。一种是山语音波形的相继主要介绍16、K个样值形成SK维矢量;另一种是由语声的参数形成输入矢量本文}bs/~4skb/{:七址中速率话音波形编码的矢量量化系统的设计。设计矢化系统的关键是设计编码器J码书的设计又是编码器设计中的重要问题、设,计码书目前普遍采川IBG算法。d。此算法是L玄。Buzo、Gray9等人在18。。年提出的它是标因。一1量量化中。川Mxa算法的多维推广〔4由于语音信号很难准确地得到多维概率分布,而通常采用训练序列的设计办法。图5所示便是这种算法的流程图根据我们对矢量量化应用于中速率i舌占编码的实际研究体会到要设计好码书应注意下面几个问题.首先就是如何构成一个好的训练序列.舍言定娜乌书大`卜从初计算停止f勺民始妈书罗罗讲,p健〔;从理论上训练序列愈长愈好,但是由于计。二输t练夫育’-D:入训序xJlTs小~。lo2…司机存储容量与计算时间的限制,rr算训练序列不能太长根据我们的经验,如果要设计一个维闺给定石马书,罗把TS划分成数K=8,码书大小N=256(即有256个码N个月包月皇字)的矢量量化器采用BIM一pC一AT计算机s犷、=f`ld`、J七》`d“,:)`幻x。,月来训练一般可编辑20多秒钟的话音话音选计算`直。`“`奋愚共芍岁“汀二,,得要典型如“他去无锡市我到黑龙江;买坏庄稼要赔;……”·相对二,二·弓立带畔}卖要公平:损说话人要有男有女并人为地将句与句之间的空隙尽量缩短。A/D变换器最好采用具有压扩特性的8位码编码器.我们采用的是具有A律压扩特性子于卿」公十遥眨出闪个月包月空白勺石马。看耸,斤石、书·`“`”书公又i十文子了“叫、“洲犷的码脉调制器片子根据此原则我们用长度J王】【几~几+ll为192000个矢量的训练序列具体设计了K二8、N=526的一个码书经实际试验效果较图6已知训练序列的LBG算法流程图好第二,要选好初始码书擎;”’。得到初始码书的常用方法有三种,即随机选取法、分裂法和乘积码书法.通过试验我们认为采用分裂法比较好具体步骤如下:(。)根据形心计算公式:Y`二一浩下刃X}15!。个川(式中,1表示矢量集合s`中矢量的大〔S`数),计算出训练序列的形心将此形心作为第一个码字Y,`”、;(b)用一个合适的参数A,乘以码字Y,`。’,形成第二个码字YZ`”’;(。)以Y:`。’Y:`。’为仅含两个码字的初始码书,用图5所示的LBG算法流程,去设计有两个码字的码书罗:`.’={Y:`.’,Y:`.’};(d)将码字Y;`.’,Y:`.’分别乘以合适的参数刀可得到四个码字Y,`.’Y:`.’,刀v:`“’,BYZ`.;(`)以这四个码字为基础再按步骤(C)去构成含有四个码字的码书然后再乘以合适的参数,以扩大码字数目.如此反复经过工goZN次计算,就得到所要求的具有N个码字的初始码书子犷。’.第三,是处理空胞腔问题一个大小为N的码书,把训练序列(如我们所设计的有192。。。个矢量)划分为N个胞腔。对于空胞腔(即此胞腔中没有训练矢量)和非典型胞腔(即此胞腔中只含有少量训练矢量)应加以处理首先把此胞腔中的形心即码字Y空去掉,然后将N个胞腔中最大的胞腔sM分裂为两个胞腔s,,,s,2.分裂的办法是这样:(a)用一个合适的参数A去乘码字YM(即胞腔s,的形心),得到两个码字Y,:二Y,Y百:=AY.:(b)以Y,:,Y,2两个码字来划分这个大胞腔构成两个小胞腔:s,:二{X!d(x夕,;)(d(x,Y,2)xos二}s,:={x】a(x,Y,:)(d(xY,,)xos,}(。)计算s二:,s,2两个胞腔的形心,用类似LBG算法最后确定两个新码字根据我们的体会对空胞腔和非典型矢量的胞腔处理后,可以提高话音的信号量化噪比约:dB,.因为用两个小胞腔替代了一个大胞腔其量化失真减小了性能得到了改善。三是很有意义的、用硬件实现skbs/波形编码器的方案随着数字通信的发展研制话音质量符合通信要求的速率为4、skbs/~、16kb/的编码器s这种中速编码器适用于移动通信。、卫星通信、、保密通信数字电话网s以及综合业务数字网(巧DN)等目前国际上标准的话音编码速率主要是64kbs/与32kb/但是飞新的数字编码技术(如子带编码多脉冲线性预测编码矢量量化等)不断涌现。只要精心设计,有可能使中速率话音编码的话音质量逐步接近自然的话音矢量量化应用于话音编码时用硬件实现的主要困难是在给定速率下其码书搜索算法的复杂度很高例如一个全搜索矢量量化系统,码书大小N=265维数K=8若以每秒800。次速率抽样,每秒钟内就要处理100个输入矢量若采用均方差失真测度每量化一个矢、量约要进行2048次加减和乘法运算故每秒钟共需进行2o84xlo。次运算也就是大约在48二中要完成加、减和乘法运算各一次。很明显目前一般的通用数字信号处理器是很难胜任这项工作的只有采取特殊措施矢量量化系统才能用硬件实现.图6所示的矢量量化系统就是采用了流水线(川Peline)作业的办法以硬件来实现该系统的图6所示为一个具有流水线性质的全搜索矢量量化系统它的码书大小N二256维数K二8,量化器速率r=lb/每样值抽样速率为氏bs/这个矢量量化系统又可以称为矢量脉冲编码调制系统(VPCM)〔“〕它的工作过程是话音信号通过截止频率为34kHz的低通滤波器后,经8位有压扩特性的A/D变换器进行标量量化再把此数字信号按一定规则轮流送到缓冲存储器1和缓冲存储器2中形成输入矢量x。每量化一个输入矢量便切换一次缓冲存储器状态(即一个缓存器处于写入状态另一个缓存器便处于读出状态)。这样,输入矢量的形成和对输入矢量作矢量量化就可同时进行此系统的迟延时间为处理一个矢量的时间(l,)5.对每个输入矢量的量化是这样进行的即先从缓冲存储器中依次读出矢量的各分量,将它与码书中某一码字相应的分量进行相减、平方以及相加运算得到本次失真:而后将本次失真与前一次的失真相比土也宝也较,保土留失真小的而弃去失真大止上寄贬止立的由于本系统是全搜索方式氮兹石写丫码书大小N=265,所以经(N一l)][5书丫.抓次比较后最终搜索到失真最小军上七七的码字这个码字就是此输入矢力O车交的量化矢量。再把这个码字的器器号送到接收端在译码端根据收到的序号在收端码书中找到相煞纂七应的码字而后经D/A变换和低通滤波器便恢复出原信号来。图618、b,、话音矢量编码的硬件实现方案本方案采用了流水线结构的运算方式即完成一步运算后一方而将结果传送到下一级去,另一方面又同时接受前而送来的数据进行新的运算这样不停顿地流水作业大大提高了运算效率因此,我们用一般的中规模集成电路片了也能完成每秒处理1000个输入矢量的任务.也就是说,lms处理一个输入矢虽大约、冼。内宛成减、加和乘法运算各一次当量序然试验板的体积比较大由于对码书设计做了较深入的研究并注意了前面所述的几改,因此,训练序列以内的信噪比约达lldB,恢复的话音可懂度较好但背景噪声较大我们认为要使编码器得到更良好的性能,应该在此基础上进一步采用自适应和线性预测技术.当然,其复杂度也要相应增加.四、结束语矢量量化是一种高效的数据压缩技术它有效地利用了矢量分量之间相互联系的四种性质:线性依赖。inearaepe,aeney)即相关(eorre不atio。);非线性依赖(。o心£nearaepend。。e夕)即统计不独立,概率密度函数(prebab川ytdesn计y了。ncitno)的形状以及矢量维数本身所以它能较全面地消除信号中的多余度高效地压缩数据〔]6.矢量量化的应用范围正在不断扩大它不仅可用于语声编码还可应用于图象编码、语识别与合成以及其它一些场合。由于这一课题的研究工作开展的时间不长故有大量工作尚待完成例如在理论上当维数K>3时,对于Rx空间究竟什么是最佳划分等;在实用上,如何有效地降低算法复杂度如何用硬件实现较复杂的矢量量化系统等等.因此.进一步开展这一领域的研究工作是很有必要的。李伟刘天民白建雄等同志对本文介绍的话音编码研制方案做了许多深入的研究工作,作者在此表示感谢参考文献(1〕5P。Lloyd,LeastSquare,Quant玉zat:on:nPCM,IEEETransaetionsonInforamtionTheoryVolIT一25,No2,Mareh1052,pp12。一137(2〕RMGray,VeetorQuantization,IEEEASSPMagazineApril1984,pp`一29〔8〕RMGray,ABuzo,AHGray,压r。andYMatsuyama,Di,tortionMeasu一e,forSpeeehProees,ing,IEEETransaetionsAeousties,Speeeh,SignalProeessing,VolASSP一25,august1980。〔4〕YLinde,ABuzo,andRMGray,AnAlgorithmforVeetorQuantizerDesing,IEEEToansaetionsonCommunieation,VolCOM一28,No1,January1980ppss一66〔6〕GDavidson,AGersho,ApplieationofAVLSIVeetorQuanti乙ationProeessortoReal一TimeSpeeehCoding,IEEEJounalonSeleetedareasinCommunieations,VolSAC一魂,No1January,1986,pp212一12`JMakhoul,5RoueosHGs,hVeetorQuantizati姐inSpeeehC司ing,Proceedin`5oftheIEEE,Vol73,No11November1985,pP1511一1558【作老简介】杨有为副教授是西北电讯工程学院信息工程系的研究室负责同志,曾发表过多篇有价值的学术论文。胡征教授1942年毕业于西南联大,现在西北电讯工程学院信息工程系从事语声信号处理、矢量量化及综合业务数字网的教学与科研工作。现为中国电子学会理事、EIEE高级会员、比EEIT优待会员。曾编著《沃什函数及其在通信中的应用》等书及发表过多篇论文。44。厂,砚声

因篇幅问题不能全部显示,请点此查看更多更全内容