可视电话系统的研究
摘 要 本文主要介绍了可视电话系统的发展过程、组成原理和实现,其中主要讨论了H.263电视编译码器、G.723.1声音编译码器、H.245控制协议及H.223多路复合/分解的原理和初步实现。同时,对可视电话的两个发展方向,即ISDN和PSTN做了相应的介绍和分析。
关键词 可视电话,H.234协议,电视编译码,控制协议 1. 引言
早在上世纪五六十年代就有人提出可视电话的概念,认为应该利用电话线传输语音的同时传输图像。1964年,美国贝尔实验室正式提出可视电话的相关方案。但是由于传统网络和通信技术条件的限制,可视电话一直没有取得实质性进展。直到80年代后期,随着芯片技术、传输技术、数字通信、视频编解码技术和集成电路技术不断发展并日趋成熟,适合商用和民用的可视电话才得以浮出水面,走向人们的视野。
近年来,可视电话在发达国家发展迅速。随着1996年国际电信联盟PSTN多媒体可视电话国际标准ITU—IH.324标准的公布,符合该标准的可视电话在美国、日本、德国纷纷开发出来并很快进入居民家庭;在国内虽受多种因素的制约,可视电话一时难以普及。但在一些政府部门、企业、团体的使用率在逐步提高。价格相对低廉的可视电话也在加紧开发中。因此,我们很有必要对可视电话系统进行深入的研究,并对其相关性能进行提升,以求生产出更好的可视电话。
2. 可视电话系统的组成
用于不同网络的可视电话系统采用的标准各不相同。本文讨论的是基于PSTN网的、遵循H.324标准的可视电话系统。
H.324可视电话系统由H.324多媒体电话终端、PSTN网络、多点控制设备(MCU)和其他的输入/输出部件组成。如图(1)所示。 H.324多媒体电话终端 H.324定义的部件
电视输入/输出设备 电视编译码器 接受通道 延时 多路 复合 /多路 分解 调制 解调器 调制 解调器 控制 PSTN 声音输入/输出设备 声音编译码器 用户数据应用 系统控制 数据协议 MCU
控制协议 SRP/LAPM过程 图(1) H.324可视电话系统框图
3. H.263电视编译码和采集输出
H.263是面向低比特率的视频压缩国际标准。采用的核心技术都是帧问预测+帧内分块DCT,然后是量化和可变长编码,以形成符合标准的码流。 3.1 MMx技术
由于PC机处理能力的不断提高,尤其是MMX技术的引入,使得基于PC的H.263视频实时编解码由理想变为现实。MMX技术是lntel公司为提高PC机处理多媒体以及通信方面的能力而推出的新一代处理器技术,同时又向前兼容。MMX技术 引入的主要数据类型分别为紧缩定点整数。定点数值的小数点是隐含的,这便于用户控制,以得到最大的灵活性。4种新的64位数据类型分别为:紧缩字节(8个字节紧缩在一个64位中)、紧缩字(4个字紧缩在一个64位中)、紧缩双字(2个双字紧缩在一个64位中)以及四字(一个64位)。新的指令集是单指令多数据指令集(SIMD),可以用一条指令处理多个数据元素,从而加速数据处理。在数据处理软件中,常常是20%的重复和循环指令占据了整个软件80% 的执行时间,因此,对少数重复和循环指令进行优化,既可以大幅度提高执行速度又避免了汇编程序的繁杂,以小的代价换取大的性能提高。 3.2 对“块效应”的后处理
简单的滤波虽然可以在一定程度上减缓“块效应 ”,但是它是以模糊图像为
代价的。本文提出一种把DCT的高频、低频系数分别处理的去“块效应”方法,此算法主要由基于块的低通滤波器和全局低通滤波器组成。通过低通滤波器可以得到图像块的高频分量即纹理信息;通过全局低通滤波器可以使块边缘的不连续性得到较好的平滑。然后将高频分量叠加到通过全局低通滤波后的图像数据上以恢复图像的纹理信息,从而达到了既较好地消除了“块效应”又不会使得图像变模糊,获得了较好的主观质量。 3.3 视频采集显示
Video for Windows AP1是Windows环境下实现实时视频捕捉的重要工具,提供视频采集和处理。DirectDraw是Microsoft推出的用于图形和图像的快速显示的技术,开发者可以利用该AP1直接对显存操作,使用显卡的硬件加速功能,以达到快速显示的目的。DirectDraw技术是围绕“表面”实现的,“表面”是存储器的一个矩形部分的DirectDraw术语,通常包括图像数据。Blitting操作通过硬件将离屏表面的内容拷贝到后备缓冲区。
4. G.723.1声音编译码和采集输出
音频采集输出利用标准声卡和Microsoft的DirectSound技术。实现时需要创建一个输入Buffer和一个输出Buffer,再设置好中断消息,当Buffer需要输入或输出时利用中断消息调用函数响应。该技术很适合用于动态语音处理。G 723.1采用多脉冲最大似然量化(MP.MLQ)和代数码激励线性预测(ALE—LP)技术,是一种混合编码,既吸取了参数编码的高压缩性,又继承了波形编码的保真性。编码时通过对原始语音进行分析提取CELP参数(LSP参数、码本索引和增益等),将这些参数编码传送;解码时用这些参数构造激励信号和合成滤波器,将激励信号通过合成滤波器以获得重建语音信号。其输出有5.3kb/s和6.3kb/s两种速率,用户可在压缩率和语音质量间选择。在人们打电话时,绝大多数情况是一方讲话,一方听话。当一方不讲话时,就可以不传话音,这样,话音带宽就可以节约50%。又由于说话中的明显停顿,有效话音仅占通话时问的30%~40%。如果采用静音检测,即:每采样一帧,在编码前先进行静音检测,如果不是话音,则不编码传送;在接收端,当没有音频数据包收到时,就向声卡输出带背景噪声的杂音,以免讲话者以为断线了。这样至少可以节约带宽60% ,从而
可以给视频分配更多的带宽资源。当然,音频的突发传输造成视频带宽的波动,进而导致视频质量的不稳定,即当对方听话时,图像质量好,当对方讲话时,图像质量就有所下降。 实现时,为了减少线程数,该模块使用两个线程,一个线程完成音频采集和编码,另一个线程完成音频解码和输出。即采样后就压缩编码,解码后就直接输出。对音频输入,虽然电话线上的语音是8kHz采样、8bits量化,但为了更好地减少失真,本文对输入音频信号进行8kHz采样、16bits量化,帧长为30ms(240个样点)。输出帧长为24bytes,速率为63kb/s。同样,解压缩后的音频数据也是8kHz、16bits。
5. H.245通信控制
5.1 抽象语法符号ASN.I
H.245使用抽象语法表示法ASN.I来定义信令的类型和格式。ASN.I是ISO和ITu—T制定的一种数据描述形式化语言,能够精确定义交换信息的类型,具有可读性好、语法形式简单、数据类型丰富、对数据结构的描述、修改和维护十分方便等优点。ASN.I支持应用协议数据单元APDU的唯一性定义,它把用户协议中的信令集合定义为一棵树,每个具体的信令在树上有唯一的树叶,编码时从根节点开始,层层扩展,直到叶节点,因此具有易扩展性和无二义性。
5.2 H.245实现
H.245的模块主要有:主从确定、能力交换、复用表交换、逻辑通道建立与关闭等。主从确定是为了解决通信过程中可能产生的冲突而设立主方和从方(如打开双向逻辑信道时)。能力交换是让对方知道自己的接收、解码能力。逻辑通道的建立和关闭是为了实现复用。复用表交换是让对方知道自己的复用格式。
编程时,对每一个模块由c++的一个类实现。系统运行时,每个模块都处于激活状态。这样,系统能够同时响应任意的H.245信令,而不会因期待接收某一特定的H.245信令而阻塞了其他信令的接收。本系统运行时,依次启动主从确定、能力交换、复用表交换、逻辑通道建立与关闭4个“过程” ,但作为Incoming 实体,可以响应对方启动的任意“过程”,这样,就可以实现与别的公司的H.324系统互连。
5.3 控制信道LCNO
H.324协议指定逻辑信道LCN0用来传输H.245控制信息。物理连接建立后,双方默认已建立LCN0逻辑信道 MUX—PDU标头中MC=0就表示信息域全部用于LCN0。链路层协议可以是简单重传协议(SRP)或v 42中的Modem链路接人控制规程(LAPM) SRP协议每发一个命令帧都必须等到得到一个相应的SRP响应帧之后,才再发下一个SRP命令帧,是一个停等式协议;LAPM 是滑窗式协议,允许多帧传输。H.324终端都必须支持SRP,LAPM 是可选的。
6.H.223多路复合/分解
为了在一条物理信道上传输不同类型的数据,需要采取一定的复用解复用(又称复分接)协议。H.223采用逻辑信道复分解,即在一条物理信道上建立不同的逻辑信道,不同媒体在不同逻辑信道上通信。H.223由复用层和适配层组成, 复用层完成多个媒体流到物理传输的复分接,即把不同媒体的数据复用到相应的逻辑信道中。逻辑信道(LC)用逻辑信道编号(LCN)标识,LCN0固定用于传输H.245控制信息,其他LC利用H.245控制协议建立和分配。适配层则针对不同的媒体完成相应的适配功能。如数据通信一般不要求实时,但要求无差错;话音对时延要求严格,但可以接受偶尔的差错;图像则介于两者之间。
7.可视电话的发展方向
由于有模拟信道和数字信道两种不同的信道可选,因此科室电话技术出现了
两种发展方向。
7.1基于ISDN的发展
ISDN基本速率接口可以为可视电话提供几倍于模拟话路的带宽,而通信费用
两者相差无几。ISDN科室电话的通信质量好,图像传输帧率高,更易于实现彩色动态图像传输速率,制式有统一的国际标准,但其发展还要受ISDN普及程度的限制。
7.2基于PSTN的发展
PSTN是最早普及的通信网络,因此,最早的可视电话就是以PSTN为传输媒
介的。平、PSTN可视电话,只使用一条模拟话路即可提供通话人黑白甚至是彩色的活动图像。
目前,PC发展迅速,这为一类新型的可视电话—多媒体可视电话的发展提供
了物质和社会基础。多媒体可视电话运作与PSTN,基于PC平台,符合国际标准,前途不可限量。其主要技术难点在于:甚低比特率条件下的图像,语音编解码技术,高速调制解调技术和系统组织技术等。
8.结束语
本文介绍了H.324多媒体电话终端,对其自身定义的模板的原理和实现进行
了初步研究。同时,还对可视电话的发展趋势进行了分析。由于PC机的普及以及人们对低端可视通信产品的热望,因此,该协议的实现有着重要的意义。
9.参考文献
1.达新宇主编.现代通信新技术.西安:西安电子科技大学出版社,2001 2. 陈德荣等编.通信新技术续篇.北京:北京邮电大学出版社,2001
3. 赵宏波,卜益民,陈凤娟编著.现代通信技术概论.北京:北京邮电大学出版社,2003
4. 张曙光,李茂长编.电话通信网与交换技术.北京:国防工业出版社,2002
因篇幅问题不能全部显示,请点此查看更多更全内容