书城社会科学数字媒体资产管理系统
49625400000020

第20章 内容的表达和元数据(4)

EDITORIAL_OBJECT_GROUP包含零个或者多个EDITORIAL_OBJECT_VERSION,另外EDITORIAL_OBJECT_VERSION可以链接到零个或者更多个EDITORIAL_OBJECT_ASSOCIASION。

EDITORIAL_OBJECT_GROUP_ASSOCIASION是一个实体,它允许可编辑对象编组,并使得这些组成为其他组的一部分,因此就形成了组的层级。每一个对象组的关联可以包括一个或者更多可编辑组或者单个的可编辑对象。EDITORIAL_OBJECT_GROUP_ASSOCIASION必须链接自一个EDITORIAL_OBJECT_GROUP,并为一个EDITORIAL_OBJECT_GROUP或者一个EDTORIAL_OBJECT_VERSION提供链接。因此,根据SMEF模型的例子,表示内容对象的可编辑对象是可编辑对象组或者可编辑对象组关联的一部分。可编辑对象可以参考可编辑对象关联,如EDL。而且,可编辑对象和节目对象版本以及项目版本相链接,因此这个例子表现了SMEF中的可编辑对象的背景。

以所有的实体及其相互关系来全面地考虑SMEF的数据模型不在本书要讨论的范围之内,它是由SMEF定义文档来完成的。这个模型考虑了所有相关的工作流和BBC媒体数据组所规定的相互关系,以及BBC的项目和其他扩展模式。整个数据模型和所有相关关系都在定义文档中有所描述。因为涉及范围广泛,所以SMEF中用分开的多个表来说明实体之间的关系。例如,这些图表有关于可编辑实体和媒体对象相关实体之间的关系、合同和角色实体之间的关系、所有与输出相关的实体及其关系等。

4.4.2MPEG-7

MPEG-7是一个由ISO/IEC活动图像专家组(Moving Picture Expert Group, MPEG)建立的标准。与其他MPEG标准(MPEG-1、MPEG-2、MPEG-4)不同的是,MPEG-7不是关于内容的视听部分的编码,而是定义了一个多媒体内容描述接口。MPEG-7的目标是提供一个广泛应用的标准,但并没有规定应用的领域和内容的类型。MPEG-7定义的元数据应用在不同层面,并且定义了低层和高层的特性。MPEG-7定义的高层特性包括标题、摘要、事件和使用历史记录等元数据,而低层特性包括配色方案、编码和区域运动轨道等概念。基于MPEG-7的描述应该能够独立使用,能够包含复杂的素材,以及与一个或者更多素材版本的联系。MPEG-7的描述处理媒体或载体或素材编码格式中独立的内容对象。

MPEG-7中的一个重要角色是表示接口的工具集,以支持用户对内容的描述和自动系统对素材和媒体的处理。这些工具由MPEG-7的三个主要元素组成:描述符、描述方案和描述定义语言(Deion Definition Language, DDL)。描述符定义了MPEG-7中视听特征表示的语义和句法。在此基础上,描述方案指定了描述这些组件间关系的语义和句法,并且支持多媒体内容的模型化和描述。DDL定义了MPEG-7相应的描述工具使用的描述语义,它指定了在MPEG-7的描述符和描述方案增强模式中应用的XML方案。

内容对象自身的描述以树形结构分层组织。在这个描述树中,节点代表描述信息,而链接表示节点间包含的关系。

4.4.2.1MPEG-7系统

MPEG-7系统部分定义了编译和处理MPEG-7描述的工具,它考虑了有效的传输和存储(以二进制格式)。它还定义了终端结构和标准接口。MPEG-7中的终端是一个使用MPEG-7描述的实体,它可以独立使用或者作为应用系统的一部分。

另外,MPEG-7系统部分处理描述方案以及二进制或动态描述的表示语言。它用所谓的访问单元(Access Unit, AU)指定了不断增加的描述的传递。AU和命令结构相似,封装了MPEG-7描述(如部分描述树)。MPEG-7的二进制格式(Binary Format for MPEG-7, BiM)定义为支持内容描述的压缩和流操作,它可以被MPEG-7工具直接解析或者转译,或者可以被标识在DDL文本描述图中(存在于BiM和DDL文本描述之间的双向图)。因此,MPEG-7的描述也可以是人们可阅读的形式。

4.4.2.2MPEG-7数据描述语言

MPEG-7数据描述语言(Data Deion Language, DDL)提供了MPEG-7文档内容和结构定义的语言。描述符和描述方案必须遵守由MPEG-7 DDL定义的句法、结构和值域。为了能够满足个人应用的具体需求,现有的描述方案可以按照语法规则进一步联合、扩展和优化。另外,还应该能够表示描述符和描述方案的关系(结构、空间、时间、时空、概念和继承等关系)。

MPEG-7 DDL是基于由MPEG-7规范扩展而增强的XML方案语言。这些扩展可以容纳视听内容描述的具体要求。MPEG-7 DDL可以被分为以下三个组件:

·XML方案结构化语言组件,它包含命名空间(指定全局唯一名)、封装定义和描述的方案封套、元素描述(指定类型定义、缺省信息和方案元素的出现频率)、属性描述(支持属性定义)和类型定义(定义内部方案组件)。

·XML方案数据类型语言组件,它包括植入的基本数据类型(如字符串、布尔、数字、浮点型等)和植入的推导数据类型(从基本类型推导而来的数据类型集合)。

·MPEG-7的特殊扩展,如数组和矩阵数据类型,以及植入推导数据类型的基本时间点和基本持续时间(基于ISO 8601)。

4.4.2.3MPEG-7视频和音频部分

MPEG-7视频和音频部分是处理关于视频和音频描述的技术和结构问题的工具。视频描述符被定义为用低级描述符来优化图片或者视频对象的标识和分类,其目的是利用这些信息使得可视化对象可以被编组和分类。基于这些描述符的检索和过滤操作要能够进行带有参数的图片和视频的检索。此时需要注意的是,检索和查找不需要基于文本查询,而是可以应用实例机制的检索(例如,“给出所有含有某个对象的图片”或者“给出具有相似文本域的图片”)。MPEG-7描述符包括:

·色彩描述符:描述颜色分布、空间输出和色彩结构。

·文本描述符:描述可视化模式,如均匀性、混色和饱和度。

·图形描述符:描述可视化对象的形状(基于区域和轮廓描述符)。

·运动描述符:描绘视频对象中的运动,如镜头移动和对象移动。

·表面描述符:描述应用的具体表面特征,如人脸识别(基于描述所有可能的表面向量的48个基本向量)。

MPEG-7的音频部分指定了低级特征,也包括高级描述工具。音频工具要被用于应用程序中,如干扰检索、口语内容检索和对音频编辑的支持。

一般的低级工具可以用于任何音频信号,它是音频描述框架的一部分,由分布序列、低级描述符(Low-Level Deor, LLD)和规范静音部分组成。LLD全面定义了两个子类型:音频LLD梯状类型(为单值描述符,如波形量)和音频LLD向量类型(为多值描述符,如频谱信息)。

高级描述符建立于标准基本层之上,它们为具体应用而定义(如优化检索操作)。声音的标识和索引工具用来索引和分类声音和声音效果,它包括声音类的分类系统和指定声音识别器的工具。口语内容工具并不直接产生简单的文本转换脚本,而是基于每个说话者声音流中的连接词和语调。该工具的目标是支持音频流和注解的口语内容的索引和检索。另外,还有对音乐乐器的描述工具(描述相关的洪亮程度和音色)以及旋律的描述工具。

4.4.2.4MPEG-7多媒体描述方案工具

MPEG-7多媒体描述方案(Multimedia Deion Scheme, MDS)工具是关于不同水平的内容描述,它们由一般描述工具和多媒体描述工具组成,覆盖了向量和时间参数,以及文本描述和可以被广泛应用于描述内容的控制词语。多媒体描述工具应用于描述一个以上的媒体,因此也更加复杂。

基本元素(方案工具、基本数据类型、链接和媒体位置以及基本工具)应用于整个MPEG-7描述方案(Deion Scheme, DS)。内容描述组件描述了内容对象的结构和语义,前者包括区域、视频帧和音频片段,它用于描述作为内容对象一部分的片段。这些片段由空间、时间或者时空边界控制。片段描述方案可以是顺序组织的也可以是层级组织的,后者例如编制一个内容表。结构特征可以由MPEG-7音频和视频描述符和文本注解来描述。

MPEG-7 MDS的语义方面包括对象描述、事件、关系和抽象概念。它们考虑描述内容对象的实际语义和概念介绍。内容对象被认为是自然叙述性的,因此,MPEG-7支持用语义描述的包含在一段内容中的叙述性的类别。语义抽象模型被定义用来描述抽象概念和抽象量。抽象量有两种类型:媒体抽象量(如描述独立于媒体的事件)和正式抽象量(如描述具有地址和可变具体事件的模式)。MPEG-7语义描述方案描述的语义实体与叙述性类别直接相关。它们包括了对象的描述(利用对象DS和代理对象DS)、事件描述(使用事件DS)、概念描述(使用概念DS)、状态描述(使用语义状态DS)、位置描述(使用语义位置DS)和时间描述(利用语义时间DS)。语义基础定义了这些语义实体的基本类型。需要说明的是,一些语义描述符和实际事件是不一致的。例如,对一个影片的记述可能设置在伦敦(语义位置),在17世纪(语义时间),但实际上影片是2002年(实际制作时间)在好莱坞(制作地点)拍摄的。语义属性可以使用标签和文本来描述内容。另外,它还考虑内容对象或者片段的参数和特征。语义属性工具也可以描述抽象层面以及时间和空间的语义度量。语义关系可以用标准的或者不标准的方式来表示。例如,标准的表示有代理、被代理、注解、被注解、用户、从属用户等。结构化和语义的描述也可以用一个支持基于结构和语义同时描述内容的连接集合来表示。

对于内容管理的目的,MPEG-7定义了一个扩展描述符集合。内容制作信息包括属性,如标题、文本注解(包括制作信息、制作地点和日期)。另外,分类信息(由风格、主题、目的、语言等组成)、回顾和指导信息以及相关材料信息(描述和其他材料的相互连接)也是制作信息的一部分。使用信息包括使用记录(如播出、根据需求传递和CD销售等)和财务描述(与制作成本以及收入有关)。权利信息并没有完全包括在内,但是考虑到了存储权利信息的链接和存在的信息模型。媒体描述处理如压缩、编码、存储格式和对管理员的描述(或者原始格式来源)等的媒体信息。所谓的媒体概要描述了内容的副本。

内容的组织表示了大量视听内容对象及其收集组织的分析和修改情况。收集工具描述了对多媒体内容、片段、描述符、概念或者混合内容的收集。其原理是使用内容组织描述符来描述如歌曲唱片的结构。模型工具被分成可能性模型、分析模型和群模型。

内容导航和访问工具要能提供优化发现、浏览、定位可视化的总结和内容的音频印象。导航支持可以是层级的或者是顺序的。视图描述考虑了空间、时间和频率方面等信号不同分解方式。它们应该支持内容在不同视图中的表示(例如,对于多分辨率的访问和进一步的检索)。最后,用户交互描述方案处理与内容使用有关的用户偏爱和使用的历史记录。

4.4.2.5MPEG-7参考工具和关系

MPEG-7定义了低级和高级描述符的扩展集合,同时也考虑了抽象模型、语义实体、属性和关系。因此定义了MPEG-7相关的基本概念列表。它含有183个概念,包括作者、带宽、特征、合同、版权、时效、编辑、图像、语言等。MPEG-7并没有提出任何具体模型或者方案,而是提供了一个描述内容的标准框架。此时需要说明的是,MPEG-7指定了一个并不包含数据库模型和描述字典的内容描述接口。尽管MPEG-7有全面的解决方案,仍然存在主要语义、语法、媒体表示、MPEG-7一般应用有关的问题。后者与组织的内部复杂度以及在层级文档结构中描述的需求有关。

MPEG-7的参考软件也是标准的一部分。试验模型(eXperimentation Model, XM)是一个具有MPEG-7描述符、描述方案、编码方案和DDL标准特征的模拟平台。有两种类型的XML应用,即服务器(提取)应用和客户端应用(搜索、过滤和转码)。