top
网赚
MPEG系列标准与应用
来源:xhf
发布时间:2008-2-17 16:05:35
一、MPEG标准的历史与发展

    ISO/IEC/JTC1/SC29/WG11/MPEG委员会成立于1988年,可以说是JTC1内最大的工作组(约300人)。该工作组制定了一系列的MPEG标准。MPEG1、MPEG2已为人们所熟知,这两个标准的制定,为VCD、DVD及高清晰度电视等产业的飞速发展打下了牢固的基础。
ISO的MPEG-4标准的第一版已于1999年1月正式公布(编号是14496),标准的第二版于1999年12月公布。目前该组织致力于MPEG-7标准,"多媒体内容描述接口(Multimedia Content Description Interface)"的制定工作,计划在2001年七月完成。新标准MPEG-21,"多媒体框架(Multimedia Framework)"的工作已于2000年六月开始,并提交了技术草案报告。
相对于MPEG 1/2两个图象压缩标准而言,MPEG-4为多媒体数据压缩提供了一个更为广阔的平台,它更多定义的是一种格式和框架,而不是具体的算法。MPEG-4的出发点就是希望建立起一个更自由的通信与研发环境,人们可以在系统中加入许多新的算法,为用计算机软件做编码、解码提供了更大的方便。它可以将各种各样的多媒体技术充分用于编码中,除包括压缩本身的一些工具、算法,还包括图像分析和合成、计算机视觉、计算机图形、虚拟现实和语音合成等技术。MPEG-4设计之初是为了在颚式破碎机电话线上传输视频和音频数据,是一个超低比特率运动图像和语音的压缩标准,但是随着研究工作的深入,它所包含的内容和将要起的作用已经远远超出了最初的设计思想。作为新技术对视频音频和因特网产业的引导,MPEG-4和MPEG-7标准的研究与应用将在今后若干年起到决定性的作用。
MPEG系列标准取得的成功主要由于以下几个关键因素:
1、MPEG出现的时候,视音频压缩解压已可用大规模集成电路实现;
2、综合了技术专家、厂家、标准化组织等多方面的意见和兴趣;
3、只规定解码应遵循标准,而不是定义的编码-解码方法;
4、主要解决信源编码问题,对信道编码未作严格规定。


二、MPEG系列标准概述

1、MPEG-1
MPEG-1的工作目标为:"最高到1.5Mbit/s的数字存储媒体的移动图像和伴音编码"。经过4年半的努力,这个新诞生的组织完成了MPEG-1标准,包括5个部分。
  第一部分说明了如何根据第二部分(视频)以及第三部分(音频)的规定,对音频和视频进行复合编码。第四部分说明了检验解码器或编码器的输出比特流符合前三部分规定的过程。第五部分是一个完整的用C实现的编码和解码器。
  MPEG-1有许多"第一次":
  (1)第一个综合了视音频的标准。
  (2)第一个定义接收端却没有定义发送端的标准。不定义发送端(当然有一些语法上的限制)的好处是,在厂家之间造成健康的竞争,以提供越来越好颚式破碎机的编码设备。
  (3)第一次能够在本地模式下对视频编码,而不管视频格式(NTSC/PAL/SECAM)如何。
  (4)第一个由所有视音频方面的行业参与发展的标准。
  (5)第一次全部用软件开发,同时包含一个标准的软件实现。
  (6)第一次提出对品质性能的评定(音频部分)。
  从该标准于1992年11月颁布的那一刻起,MPEG-1取得了一连串的成功,如VCD和MP3的大量使用,Windows95以后的版本都带有一个MPEG-1的软件解码器,可携式MPEG-1摄像机等等。

2、MPEG-2
MPEG-1是一个应用领域相当受限的视音频编码标准。而另一方面,不管数字电视究竟如何定义,越来越清楚的是业界需要能够提供数字电视的服务。
 (1)技术上,MPEG-1实现图像无交叉的编码,但是电视节目是交叉的(隔行扫描)。
 (2) 广播电视的传输系统一旦数字化,缺乏MPEG-1系统所要求的理想传输性能。
 (3) 数字电视需要在音频上提供更为丰富的体验,这意味着要支持多通道的音频。
 (4) 对为电视提供一定程度交互的兴趣则造成了一个可交互协议的需求。
 (5)数字电视和模拟电视的主要区别就是质量。数字电视标准应能拒绝非授权用户对内容的访问。
  MPEG-2"通用的移动图像和伴音编码"即为满足所有这些需求的解决方案。从1990年7月开始,经过四年半到1994年11月完成标准,以后还有一些小的改进。它的结构与MPEG-1相似,并增加了新的补充部分。
  第一部分定义了两种复用。第一种,称为"节目流",类似于MPEG-1系统。第二种,称为"传输流",定义了一个面向数字化模拟系统(有线,卫星,陆地网络等)的传输层接口。它也提供一个能够插入私有的访问控制系统的下层结构。
  第二部分扩展MPEG-1,提供对视频交叉编码的方法。第三部分将MPEG-1从立体声扩展到多通道,同时保留了向后兼容(即,MPEG-1的音频解码器能够从MPEG-2的音频比特流中解出立体声部分)。
  第四和第五部分与MPEG-1的相对应。第六部分名为"数字存储媒体命令与控制(DSM-CC)",提供协议来控制视音频流,建立异构网络上的视音频会话,和用于广播数据轮。
  第七部分名为"高级音频编码(AAC)",提供可选的,非MPEG-1兼容的立体声和多通道音频编码方法。使用AAC,只需要MPEG-1在第二层音频编码一半的比特率,而达到同样的品质。
  第九部分名为"系统解码实时接口(RTI)",定义了系统解码器所能承受的抖动水平。
  自从MPEG-2诞生以来,视音频领域发生了巨大的改变:已经售出了大量的卫星和有线电视的解码器(机顶盒)、DVD播放器,基于MPEG-2的HDTV开始启动,4:4:2的规范(profile)用于演播室的高质量编辑等等。

3、MPEG-4
MPEG组织在1993年7月开始了MPEG-4"视音频对象编码"的研究。该标准的设计需求包括:
 (1)高效的,特别是在低码率下对视频信号编码,在相当时间内(因特网应用或移动信道的电话线路的数字化),这将是一个基本限制;
 (2)具有向上可扩展的编码格式。在更高的比特率有效时,保证编码格式的连续性;
 (3)能在一个大的比特率范围内对音频信号--语音和音乐进行编码;
 (4)提供编码算法内嵌的错误恢复,特别是在移动应用中;
 (5)编码对象,特别在视频中,如一个说话的人,一辆行驶的车等。把它们与视频图像的其他部分区别开;
 (6)提供内容交互的协议;
 (7)表现音频的3D空间;
 (8)对一般形状的3D时变物体能够有效编码;
 (9) 根据传输机制确定品质表现的层次;
 (10)内容保护使授权用户才能访问。
  ……
  所有这些需求最后都转化为明确的标准--MPEG-4。它有六个部分,每个部分的内容与MPEG-2中的非常相似。

  MPEG-4的一个特点是更适于交互AV服务以及远程监控,这是第一个使你由被动变为主动(不再只是观看,允许你加入其中,即有交互性)的动态图象标准。它的另一个特点是其综合性,从根源上说,MPEG-4试图将视觉效果意义上的自然物体与人造物体相溶合,所以它的设计目标还有更广的适应性和可扩展性。与前两者不同,MPEG-4不仅是针对一定比特率下的视频、音频编码,更加注重多媒体系统的交互性和灵活性。
  MPEG-4引入了AVO(Audio/Visaul Objects)的概念,使得更多的交互操作成为可能。AVO的基本单位是原始“AVO”,它可能是一个没有背景的说话的人,也可能是这个人的语音或一段背景音乐等。
  它具有高效编码、高效存储与传播及可交互操作的特性。在MPEG-4中AVO有着重要的地位,因为MPEG-4采用AVO来表示听觉、视觉或者视听组合内容,允许组合已有的AVO来生成复合的AVO,由此生成AV场景,并采用SNHC的方法来组织这些AVO。对于AVO的数据还能灵活地多路合成与同步,以便选择合适的网络来传输这些AVO数据,并允许接收端的用户在AV场景中对AVO进行交互操作。
  为了达到低比特率下的多媒体通信和多工业的多媒体通信的综合这两个目标,MPEG-4标准的构成也有所更新。
 (1)DMIF(The Dellivery Multimedia Integration Framework)
  DMIF即多媒体传送整体框架,它主要解决交互网络中、广播环境下以及磁盘应用中多媒体应用的操作问题。通过传输多路合成比特信息来建立客户端和服务器端的握手和传输。通过DMIF,MPEG-4可以建立起具有特殊品质服务(QoS)的信道和面向每个基本流的带宽。
 (2)数据平面 MPEG-4中的数据平面可以分为两部分:传输关系部分和媒体关系部分。为了使基本流和AVO在同一场景中出现,MPEG-4引用了对象描述(OD)和流图桌面(SMT)的概念。OD传输与特殊AVO相关的基本流的信息流图。桌面把每一个流与一个CAT(Channel Assosiation Tag)相连CAT可实现该流的顺利传输。
 (3)缓冲区管理和实时识别 MPEG-4定义了一个系统解码模式(SDM),该解码模式描述了一种理想的处理比特流句法语义的解码装置,它要求特殊的缓冲区和实时模式。通过有效地管理,可以更好地利用有限的缓冲区空间。
 (4)音频编码 MPEG-4的优越之处在于,它不仅支持自然声音,而且支持合成声音。MPEG-4的音频部分将音频的合成编码和自然声音的编码相结合,并支持音频的对象特征。
(5)视频编码 与音频编码类似,MPEG-4也支持对自然和合成的视觉对象的编码。合成的视觉对象包括2D、3D动画和人面部表情动画等。
(6)场景描述 MPEG-4提供了一系列工具,用于组成场景中的一组对象。一些必要的合成信息就组成了场景描述,这些场景描述以二进制格式BIFS(Binary Format for Scene description)表示,BIFS与AVO一同传输、编码。场景描述主要用于描述各AVO在一具体AV场景坐标下,如何组织与同步等问题。同时还有AVO与AV场景的知识产权保护等问题。MPEG-4为我们提供了丰富的AV场景。

4、MPEG-7
MPEG 7的目标就是对日渐庞大的图像、声音信息的管理和迅速搜索。针对这个问题MPEG-7于1998年10月提出,预计于2001年7月最终完成并公布。MPEG-7将对各种不同类型的多媒体信息进行标准化的描述,并将该描述与所描述的内容相联系,以实现快速有效的搜索。其正式的称谓是"多媒体内容描述接口"。
MPEG-7可以形容为"基于语义的表示"。MPEG-7将指定一个用于描述各种多媒体信息的描述符标准集。MPEG-7还将对定义其他描述符的方法进行标准化,也包括标准化描述符及其相互关系的结构(描述计划,Description Schema)。MPEG-7也将标准化一种说明描述计划的语言,如Description Definition Language(DDL)。视听材料如静止图像,图形,3D模型,音频,语音,视频,和关于这些元素在一个多媒体表达中是如何结合的信息,通过MPEG-7的描述,就能被索引和搜索。

5、MPEG-21
MPEG-21标准是由MPEG-7发展而来,主要规定数字节目的网上实时交换协议。


三.MPEG系列标准的比较

  MPEG-1直接针对1.2Mb/s的标准数据流压缩率,其基本算法对于每秒24~30逐行描帧,分辨率360×280,运动图象有很好压缩效果。但随着速率的提高,解码后图像质量较差,并且它没有定义用于对额外数据流进行编码的格式。
  MPEG-2力争获得更高的分辨率(720×486),提供广播级视频和CD级的音频。作为MPEG-1的一种兼容型扩展,MPEG-2支持隔行扫描视频格式和其它先进功能。MPEG-2以可扩展档次的形式来定义,每个档次支持一种特殊应用所需的功能,因此它是一种通用标准。但是MPEG-2标准数据量依然很大,一部影片的数据量大到8G字节左右,不便存放和传输。
  MPEG-4视频格式大大优于MPEG-1与MPEG-2: 视频质量与分辨率高,而数据率相对较低。主要的原因在MPEG-4采用了基于对象的编码技术,可以使用很低的数据率。这可以将整部视频电影以完全PAL或者NTSC的分辨率与立体声(16位, 48 kHz)存储在单个CD-ROM上。具体而言:700 MB的容量对多数110分钟的电影来说绰绰有余了,而MPEG-2格式的电影在相同的分辨率下需要约11倍以上的储存空间。当MPEG-2的数据率加倍至接近真正的特性时,MPEG-4可以在声频与视频流上在广泛的领域上升级。 当视频在5 Kbit/s与10 Mbit/s之间变化时,声频信号可以在2 Kbit/s 与24 Kbit/s之间进行处理。由于这种可升级性,声频与视频数据可以经专门调整适应真正的环境。
  另外,由于MPEG-1和MPEG-2标准均为高层媒体的表示与结构标准,其交互性及灵活性较低。而计算机网络具有很高的灵活性和交互性,但它遵循的标准确与MPEG标准不兼容。MPEG-4的制订有效的促进三网的融合。MPEG-4中一个重要概念是视频对象(VO),一幅图像的编码时分割成很多任意形状的VO,分别对各VO进行帧内、帧间编码。必要时只传输某些VO,大大地提高了传输效率。如果视频没进行分割,那么编码结构就退化为只处理标准矩形的一层,这种处理方式与MPEG-1/MPEG-2标准类似,从而达到与MPEG-1/MPEG-2的兼容。
  继MPEG-4之后,人们又对解决日渐庞大的图像、声音信息的管理和迅速搜索产生了兴趣,MPEG提出了解决方案MPEG-7。它重点放在用于描述多媒体素材(描述与内容有关的信息以方便检索等)的通用接口标准上,因此MPEG-7并不是兼容以前的标准,而是以前标准的扩展和延伸。

四、MPEG系列标准的应用

MPEG标准系列由于不存在专利权的问题,所以更适合于我国国情,在近十年中,MPEG在我国得到广泛应用。
  众所周知,基于MPEG-1的影碟曾风云一时,其产品VCD,早已得到广泛应用,它的图像质量和清晰度已被用户接受。然而,随着MPEG-2标准的出台,各个厂家都在追逐接近数字演播室标准CCIR601和HDTV中所需的视频质量。DVD的推出使VCD在市场的霸主地位动摇了,在不久它将取代VCD。由于一路MPEG-2码流中可以同时传输多套电视节目,用户可以根据喜好收看其中某一套节目,即视频点播(VOD)业务。数字机顶盒的推出也是成功运用MPEG-2标准的典型,它是广播业务走向全数字化的过渡产品。可以预计,DVD和数字机顶盒在未来的几年中将是百姓消费的主流。另外,由于MPEG-2标准的突出表现,在高清晰度电视的应用领域占有一席之地。MPEG-2标准还可用于为有线电视网、电缆网络以及卫星直播提供广播级的数字视频(DVB)。如果说MPEG-1使得VCD取代了传统的录象带,而MPEG-2将使数字电视最终完全取代现有的模拟电视。
  最新视频格式MPEG-4的应用举不胜举。例如,现在可以在家用PC上将DVD转换为MPEG-4格式,然后就可以在笔记本电脑上播放了(无需DVD-ROM驱动器)。声频信号能够以MPEG-4压缩通过Internet实现"声频点播"。这种数字声频传播之所以可能实现是因为它只需要约16 kbit/s的宽带。这种情况与视频服务及2D或3D对象的动画相似,这些服务与动画能够以不同的数据率通过Internet同时进行传送。另外MPEG-4在以下方面的应用一直看好:数字电视制作与播出、动态图象、互联网、实时多媒体监控、低比特率下的移动多媒体通信、于内容存储和检索多媒系统、Internet/Intranet上的视频流与可视游戏、基于面部表情模拟的虚拟会议、DVD上的交互多媒体应用、基于计算机网络的可视化合作实验室场景应用等等。
MPEG-7的应用范围很广泛,既可应用于存储(在线或离线),也可用于流式应用(如广播、将模型加入Internet等),还可以在实时或非实时环境下应用,如:数字图书馆(图象目录,音乐字典等)、多媒体名录服务(如黄页)、广播媒体选择(无线电信道,TV信道等)、多媒体编辑(个人电子新闻业务,媒体写作)等。另外MPEG-7在教育、新闻、导游信息、娱乐、研究业务、地理信息系统、医学、购物、建筑等各方面均有较深的应用潜力。
top
版权所有 苏州市新鸿飞电子设备有限公司 ALL RIGHTS RESERVED 苏ICP备06047635号

地址:滨河路何山花园十幢 电话:0512-68087376 传真0512-68094915