书城计算机网络多媒体技术
13955600000038

第38章 多媒体通信技术(2)

如果只有两个终端参加会议,则音频处理器的语音混合功能由切换功能代替。考虑到视频信号的时延,在音频处理器内应对音频信号进行一定的延迟(不大于30ms)。

5)视频处理器

类似于音频处理器,视频处理器对输入视频信号也有两种处理方式:一种是进行视频切换,以便插入信道帧后分配到各个会场,无须对视频信号进行处理;另一种是进行视频混合,当一个会场需要同时看到多个会场的图像(在一个显示器上同时看到其他所有会场的图像或分屏显示)时,MCU可对多路视频信号进行混合处理。这种混合是对多个图像以分屏形式空分复用一个组合图像。

6)数据处理器

数据处理器为可选单元,包括H.243建议的数据广播功能,以及按照H.200/A270系列建议的多层协议(MultiLayerProtol,MLP)完成非话音信息的处理。

在MLP数据处理功能时,数据处理器可以执行以下操作:

①处理远端信息;

②传输会议控制信号(请求/确认信号、主席控制令牌、音频/视频切换)。

7)控制处理器

控制处理器负责确定正确路由、混合/切换以及传递给每个多路复用器的音频、视频、数据及控制信号的格式和时序关系,同时具有会议控制功能。

8)多路复用器

多路复用器把从音频处理器、视频处理器、数据处理器和控制处理器送来的数据流组帧并插入BAS码值。

2.MCU的基本功能

1)时钟同步和通信控制

在多点控制方式中,各个终端都要以双向通信的方式与MCU连接,MCU处于星型结构的核心。MCU要按照会议控制者的要求进行处理后再发送出去。所以,MCU各个端口上的信息流必须同步在同一个时钟上。MCU将各个终端输入的信号流统一在系统控制时钟上,校验各个码流的帧定位信号,输出处理后的分配信号以及复帧同步信号。

在通信控制方面,MCU支持各端口的信令和互通方式,支持P×64kbps(P=1~30)速率信号的通信,完成主席控制、语音控制和演讲人控制等会议控制功能。MCU要协调整个系统中各个终端的信息处理能力,选择各个终端均可接受的通信能力,例如要考虑传输速率、编解码方式和数据协议等。

2)码流控制

MCU要对从各个终端输入的所有码流进行处理。MCU对符合H.221标准的复合会议视频流进行解复用处理,对分解出的各路压缩数字视频信号不进行解码,而是将视频码流直接发送到目的终端;对分解出的各路压缩数字音频信号进行解码得到多路PCM信号,然后对多路PCM信号进行叠加处理后形成混合语音信号,再对这一混合语音信号进行最后的压缩处理后发送到目的终端。

3)MCU的端口连接

MCU是一个多端口连接设备,其端口数已经由最初的8个发展到现在的几十个。MCU可以使用的最大端口数还与各个端口使用的信号速率有关,例如一个典型的MCU可以支持8个E1端口,而在384kbps速率下可以支持16个端口。MCU还可以用来控制若干个独立的分组会议,只要参加会议的终端总数不超过MCU的最大端口数,例如一个8端口MCU可以同时支持两个独立的分组会议,其中一个会议由2个终端组成,另一个会议由6个终端组成。

9.2.5视频会议性能要求

视频会议性能指标可以概括为功能性指标和音视频质量指标两大类。功能性指标如MCU控制操作界面的方便性、各种控制功能能否实现及实现的稳定性、摄像机的远程控制、多画面合成显示、语音混合、终端参数的设置、会议控制、软件升级等。音视频质量指标是视频会议系统性能最直接的反映,音视频质量主要受系统时延、抖动、编码标准、动态切换时间等因素的影响。

1.图像质量的评价

图像质量的评价分为主观评价和客观评价两种。

图像主观评价的测试环境和方法可参考ITURBT.500建议书或GY/T134-1998中5.1的规定执行,评价方法采用双刺激连续质量标度方法(DoubleStimulusContinuousQualityScale,DSCQS)。关于图像质量的客观评价,主要通过测试一些影响视频图像质量的失真参数进行。主观评价和客观评价的结果应一致。

2.时延的影响

系统时延包括网络传输时延和设备时延。当网络QoS满足端到端延时小于200ms、丢包率小于1%、网络抖动小于50ms的条件时,终端所提供的视频服务质量不应该受到影响。当网络QoS质量出现瞬间变化,但端到端延时不超过400ms、丢包率不超过10%、网络抖动不大于100ms的时候,终端所提供的视频服务质量不应受到永久性影响。

设备时延由编解码时延和为防止时延抖动而设定的缓冲区引起的时延两部分组成。视频编码时延相对于音频来说较大,因此在视频会议终端中应对音频进行一定的延时,以保证“唇音同步”。不同的视频编码标准,不同的硬件实现平台,其延时也不一样,如基于DSP的H.264标准编码器的时延就比一般编码器的时延大很多,因而其实现也复杂得多。

H.323视频会议终端设备可以在终端代理的命令下从一种编码方式切换到另一种,或在同一种编码方式的不同速率间进行切换,其动态切换时间应不大于60ms。

3.语音质量的主观和客观评价

语音质量的评价分为主观评价和客观评价,实际应用中主要以主观评价方法为主。

整个视频会议系统的语音质量不仅与终端设备有关,也与IP承载网络以及会议室声学环境有关。在网络条件好的情况下(网络无丢包和时延损伤),MOS评分应达到4.0分以上;在网络条件一般的情况下(网络有l%丢包,时延在100ms的基础上有20ms抖动),MOS评分应达到3.5分以上;在网络条件较差的情况下(网络有5%丢包,时延在400ms的基础上有60ms抖动),MOS评分应达到3.0分以上。

对于语音质量的客观评价,与G.711、G.722、G.723、G.729建议书中对音频客观指标的要求相同。

9.3视频点播(VOD)系统

9.3.1VOD概述

交互式多媒体信息点播系统以电视技术、计算机技术、通信网络技术为基础,为用户提供不受时空限制地浏览和播放多媒体信息的人机交互应用系统。在目前阶段,交互式多媒体信息系统的主要应用集中于视音频信息的点播,即VOD(VideoOnDemand)。

VOD是一种受用户控制的视音频分配业务,可让观众自由决定在何时观看何种节目。它使分布在不同地理位置上的用户可以像使用家用录像机一样交互式地访问远端服务器所存储的节目,而它所提供的丰富的节目源和高质量的图像质量则是家用录像机所无法比拟的。VOD服务的“节目提供者”将节目存储在“视频服务器”中,服务器随时应观众的需求,通过“传输网络”传送到用户的家中,然后由用户多媒体终端将压缩的视音频信号解码后输出至显示设备,用户即可欣赏自己需要的节目。

VOD又可分为真点播电视(TrueVOD,TVOD)和准点播电视(NearVOD,NVOD)。在TVOD中,每个用户各自占有一套节目,节目一经点播就能得到及时响应,人们对装设在信息中心和电视台视频盘和视频带上的节目可以随意控制。用户可以实时地启动节目的播放,在收看过程中可以控制节目的快进、快退、暂停等。在TVOD中,每个用户独占一条通信链路和一部分点播服务器资源,因而对通信网和服务器配置均有较高要求。

NVOD则是每隔一定时间(如10min)从头播放一套节目,用户在观看电视节目并发出点播信号后,交换机将用户终端与最近将要从头开播的频道连通,用户需等待几分钟才能看到所点播的节目,但等待时间不会超过规定的时间间隔。在NVOD中,所有用户共享若干条通信链路和部分点播服务器资源,因而减弱了对通信网和服务器的压力。NVOD通过引入一定的延迟时间,提高了系统资源的共享程度,从而降低了系统的造价,同时也降低了系统技术实现的难度。它的延迟在许多情况下对用户的影响是不大的。在等待时间内还可向用户播放存储资料、广告或音乐视频插曲,这样使服务提供者能用广告利润来补偿用户费用,是一种较为经济的点播模式。

VOD系统和其他通信与信息系统相比,有其特有的性质。

1.信息流向的不对称性

对于大多数双向通信系统来说,信息通路两个方向上的信息流量是对称的,系统要为通信的双方提供同等的通信能力,而VOD系统信息通路两个方向上的信息流量是不对称的。对VOD系统而言,大量的多媒体信息由信息提供者流向用户,而由用户发往信息提供者的点播控制信息则少得多,因此系统要为通信的双方提供不相等的通信能力。

2.点播信息内容和点播时间的集中性

对于VOD系统的广大用户来讲,在某段时间内他们感兴趣的内容往往是相当集中的,点播的信息内容将集中在信息集合中的很小一部分,如热门体育、新闻节目、新上映的电影、电视剧等,其节目库中15%的热门节目可能会提供97%的点播率。

另外,用户点播信息的时间分布也是不均匀的,可能集中于节假日或是一天中的某些时段。这种点播信息内容和点播时间的集中性,造成了信息流量的突发性特点。

3.信息发送与重现的实时性与同步要求

VOD系统与其他信息检索系统相比,其信息发送与重现的实时性与同步要求性要求都较高,特别是对视音频信息的点播必须保证视频媒体与音频媒体内部各自的同步,以及视音频媒体间的同步,这对系统的延时及抖动特性均提出了较高要求。

9.3.2VOD系统结构

按照信息流在不同网络的传输,VOD可以有不同的系统结构。

1.逻辑结构

1)节目提供者

在VOD系统中,节目提供者完成的主要功能是节目制作和存储,如浏览器和各种应用的用户界面制作,各种应用的具体节目内容的制作(如远程教育中的课程内容、家庭购物中的商品信息、电影点播中的电影节目等)。媒体制作是多媒体服务的源泉:音频、静态图形、动态图像、文本以及数据如何组织,是很关键的问题。多媒体的制作标准很多,针对不同的播放设备有不同的标准,针对交互电视网上实时性、交互性以及图像质量的比较,MPEG逐渐成为一种主流标准。因为这种压缩标准不仅有效地压缩了数据,而且包含了一个系统层,这样就有可以用来建立点到点的连接,终端到终端的信令,十分方便地把多媒体数据流转换成ATM信元或IP包进行传输。

节目的制作系统应包括视频压缩设备,电影、电视、新闻等节目,其原始资料可能是录像带、CD、胶片,应由编码系统将它们压缩成符合MPEG的视频流,以便终端正确地回放出来。其次,节目的制作系统提供者还应包括节目的存储系统,可以有录像带、CD等,也应有能快速访问的大容量磁盘。节目制作系统是VOD系统一个十分重要的部分,节目的好坏、用户界面是否吸引人、是否友好,将直接影响用户对这个业务感兴趣的程度。

2)服务提供者

服务提供者包括相关的服务器设备和业务传输的网络。在VOD系统中媒体服务器是一个沟通用户和节目提供者的桥梁,然而节目提供者并不是直接与用户打交道,而是通过分配网络和服务器与用户建立联系。用户需求首先被送到服务器,由服务器的业务网关分析用户所要的服务,并与用户建立会话连接,然后服务器再从节目提供者上调取相应的节目内容,通过网络送给用户。因此,服务器应具有与网络的接口、连接控制功能、会话控制功能、分析和处理各种业务的能力以及在节目提供者和用户之间传送节目的能力。

VOD的传输分配网络按照不同应用会有所不同,较大型的网络可以分为核心网和接入网两部分。核心网可以采用SDH技术、ATM技术等传输技术。接入网主要采用的宽带接入网包括HFC、ADSL和FTTX。

除此之外,媒体服务器还要完成节目的存储和回放控制。为满足广大用户的不同要求,媒体服务器要存储大量的节目,因而需要一个海量的存储系统。半导体存储器由于价格昂贵,一般作为高速缓存器;磁带由于性能差,只能用于资料性节目的存储;磁盘的容量大,价格和性能适中,一般作为在线存储系统的主体。随着光盘存储技术的快速发展,正逐渐进入媒体服务器的应用。为了节省存储空间和传输带宽,一般情况下节目要经过数据压缩。服务器通过与终端的交互作用来控制节目的播放,包括各种VCR的控制功能。

3)业务消费者

业务消费者就是用户终端。VOD用户终端也可以有多种,最常用的一种是机顶盒(SetTopBox,STB),另外也可以用计算机做终端。机顶盒是用户显示设备、外围设备以及传输网络之间的桥梁。简单的机顶盒只需要解码显示功能和一个反向信道,但是随着业务的发展,许多新业务的提供者都认为机顶盒涉及新业务的引入方式,从而使机顶盒的结构趋于多功能化。从硬件结构上看,STB可分成网络接口单元(NetworkInterfaceUnit,NIU)和机顶单元(SetTopUnit,STU)两部分。采用NIU和STU分开的这种结构的目的是使STB可以不做大的改动就能够接入到不同的网络中,从而厂家无须为各种网络单独设计STB。

NIU负责与网络的接口,不同的接入网络结构可以有不同的NIU,包括不同的物理接口、调制方式和连接控制机制。STU接受和分析用户通过遥控器等发来的或是网络传送来的控制信息,按各种信息的协议栈进行分析或组装,因此STU需完成MPEG、TCP/IP等各种协议的处理。

从概念上讲,VOD的逻辑结构如图93所示。

图93VOD逻辑结构

2.物理结构

VOD系统是一种多级服务器和多级网络交换的结构,具体地说,VOD系统由节目提供、管理中心、视频服务器、传输网络和终端五个部分组成。