生产 MPEG2 解码器的厂家很多,产品也不少,如 IBM、NEC 和汤姆逊公司等。 DVD 的技术规格:⊙外形采用双面结构,直径为 12 厘米,厚 1.2 毫米,
由厚 0.6 毫米的两张盘片粘合而成;⊙DVD 的存储采用 SD 技术,存储量为每
面 4.7GB,可存储 135 分钟的经 MPEG2 格式标准压缩的广播级电视图像及其 伴音,数据读取则采用 MMCD 的单面方法;⊙信号调制方式采用 MMCD 的 EFM Plus 方式;⊙误差修正方式采用 SD 的 RS—PC 方式。
DVD 图像参数:DVD 的技术核心是 MPEG2 标准,MPEG2 标准的图像格式共
有 11 种组合,DVD 采用的便是其中″主要等级″的图像格式,使其图像质量 达到广播级水平。具体的图像参数为:PAL 制——720×576,25 帧/秒;NTSC 制——720×480,30 帧/秒。
三、一次写/多次读光盘
1.一次写/多次读光盘
一次写/多次读光盘是用户自己将所需的信息记录在光盘上,这种光盘提 供了可写一次的机制,即一次性写入或一次次续写。当把信息写入光盘后, 光盘介质发生物理变化,信息永久记录于此光盘上,不可修改、删除或重写, 这种光盘被称为 WORM。
早期的 WORM 为 5.25 英寸大小,价格较高,基本上没有投入大批量使用。
现在一种新型的 WORM 型产品 CD—R 投入市场后,盘片价格较低,且不断下降
(进口的 CD—R 盘片 20~30 元,国产的 CD—R 盘片 10 元),CD—R 光驱从
4000 元到 10000 元之间,使一次写/多次读光盘真正有了实用的价值。
2.CD—R 盘片
CD—R 盘片的结构与 CD—ROM 基本相同,盘的直径为 120 毫米,孔径 15 毫米,厚 1.2 毫米。两者均为三明治式结构,底层为聚碳酸酯,上层是保护 胶膜。两者的区别仅在于 CD—R 比 CD—RCM 多一记录介质层,并且有正旋波 形的预刻槽,用于 CD—R 盘片在驱动器中的转速控制。记录介质层为有机染 料,如酞花菁(phthalocyanine)、花菁(cyanine)或金属,反射层通常采 用反射率、熔点较高的金属,最常用的是金。CD—R 采用金膜是由于金具有 良好的抗腐性和很高的光反射率。此外,CD—R 夹层中的多膜与底层之间还 有一层染料层,在写入器大功率光束的激励下,染料层变形,在底层形成与 CD—ROM 那样的“地”与“坑”,以表示二进制数据。
常用的 CD—R 盘片按容量区分有三种:CD—R18、CD—R63 和 CD—R74,
分别是对应于 18、63 和 74 分钟或者 175、553 和 650MB 的存储容量。与激光 唱片一样,信息只记录在单面。
CD—R 盘片的使用寿命约为一般 CD—ROM 盘片的 3 倍,可达 100 年。 据报道,IBM 的研究人员已在实验室研制成 2 个和 4 个记录面的 CD—R,
并宣称,制作 10 层或 20 层盘片在技术上已不存在问题。
3.CD—R 一次写入的原理
CD—R 一次写入的原理是,在对应 CD 导入区(存放文件目录表)的前面 增加了 PMA(Program Memory Area)和 PCA(Program Calibration Area) 两个区。其中 PCA 区用于调整写入激光波长的功率,因为不同的 CD—R 的染 料型记录层的激光响应波长不同;PMA 区用于存放追加数据信息的目录,当 整盘数据录入完成后,再将 PMA 区中的目录写入导入区,这时 CD—R 就成为 记录有信息的只读型光盘。
通常 CD—R 有两种记录方式,一种是用激光在记录层烧蚀凹坑,另一种 是用激光加热使染料型记录层变色,变色部分的反射率比附近区域低得多; CD—R 的记录格式和 CD 相同,即 CLV 和 MER;记录的数据格式,则是根据需 要,按照相应标准,把空白 CD—R 写成 CD—DA、CD—ROM 或 CD—I 格式。读 出都是利用反射激光光强的变化来实现,与 CD 读出原理相同,所以 CD—R 上记录的信息可以在通用 CD 驱动器上读出,即与 CD 读兼容,这也是 CD—R 受市场重视的原因。
4.CD—R 的应用
CD—R 是一种正在兴起的新技术,即使在国外,它的应用也起步不久,许 多应用领域还有待于进一步开拓。一般地说,它适应于那些只需要制作少量 CD—ROM,或者由于安全等原因不便将信息外传的 CD—ROM 软件制作部门。具 体地说,目前可用于以下几个方面:
(1)大容量多媒体存储。CD—R 用来存放固定不变或不经常改变的信息 是最理想的介质,可广泛应用于各种平台的多媒体文档管理系统。尤其是对 于那些拥有敏感数据的单位,诸如国防、安全、银行等部门,CD—R 具有它 所特有的优越性。
(2)信息发布。有些企业、商业宣传部门经常需要制作一些多媒体宣传 材料,例如产品发布展览会上演示或信息交换用的资料等,且 CD—R 具有携 带、邮寄方便等优点。
(3)CD—ROM 样品。CD—ROM 软件制作人员可先在办公室里制作少量的
CD—ROM 样品,待测试、修正后再送工厂批量生产。这样可以大大提高 CD— ROM 制作的成品率,缩短制作周期。
(4)硬盘后备。目前,多数硬盘仍然采用磁带作为数据后备。磁带上的
数据不但日久容易丢失,而且工作方式是顺序读出,速度很慢。采用 CD—R 就可以避免这些缺陷。新型的 CD—R 系统均可对盘片进行逐次写入。因此, 一张 CD—R 盘片在没有写满以前可多次使用。
(5)照相 CD。将照相底片或幻灯片连同声音记录在 CD—R 上,可通过多
媒体计算机欣赏图像,聆听声音。这种将 CD—R 用作电子相册的业务,在国 外有些照相馆已经向用户开放。照相 CD 技术还可用作建立医疗图像库。
(6)图文存储。在有些文档存储系统中,需要将某些原始文件原封不动
地记录下来,例如法律文件、信用卡、医疗记录与工程图等。以往,这些领 域多采用缩微胶卷来保留原始文件。采用 CD—R 不但可大大提高检索速度, 而且可降低成本。
5.CD—R 系统构成
CD—R 写入系统主要包括:计算机、CD—R 写入器、1GB 以上的硬盘、SCSI 接口以及预制作和制作软件。
计算机系统可以是 IBM 兼容机、Macintosh、Sun SPARC 工作站等机种; 操作系统可以是 DOS、Windows 或 UNIX 等。为了获得较好的写入效果,最好
用 RAM 4MB 以上、CPU 性能相当或超过 486 的机种。
CD—R 写入系统要求配置一个 1GB 以上的高速硬盘。因为在写入器向 CD
—R 写入的过程中数据流不能中断,对于倍速的写入器,硬盘的数据传送率 最好在 600kB/s 以上。在向 CD—R 写入以前,需要先在硬盘上建立一个 CD—
R 映象,因此硬盘容量最好大于被写入数据容量的 2 倍。
写入系统的核心是 CD—R 写入器。这种写入器最早是由 YAMAHA 和 Sony
推出的,最初的售价为 2.5~5 万美元。最近价格已跌到 1200 美元以下,从 而打开了 CD—R 广泛应用的大门。
CD—R 写入器的主要技术指标是数据传送率、缓冲容量以及是否支持逐次 写入。CD—R 的工作速度用数据传送率来衡量,这是指写入头向盘片送入数 据的速度。与 CD—ROM 驱动器一样,有单速、双速、三速和四速四种,传送 率分别为 150kB/s、300kB/s、450kB/s、以及 600kB/s,目前最流行的是双速 写入器。
缓冲器用来存放来自硬盘的数据,并由此将数据写入 CD—R。它必须有足 够大的容量,以保证写入数据的连续性,在写入过程中不能变空。一般写入 器的缓冲器容量为 256kB~2MB,最大可扩充到 32MB。
CD—R 写入器的另一个指标是一张盘片上的数据是否可以分若干次写 入,即所谓逐次写入。目前,多数写入器已具备这种功能。大部分写入器可 兼用作 CD—ROM 读出器,读出速度不一定与写入相同,例如双速写入的机器 在读出时可能只是单速。平均无故障时间为 2~5 万小时,国内售价为 3.5~
4 万元之间。
CD—R 写入器与计算机之间采用小型机的标准接口 SCSI,目前用得较多 的卡是 Adaptec1540/1542,它们能提供较高的数据传送率。1GB 以上的硬盘 也可用此卡与写入器连接。但有经验的 CD—R 制作人员建议,为了工作可靠, 最好两者分别使用二块独立的 SCSI 卡。
预制作与制作软件主要完成四项工作:在硬盘上生成 CD—R 映象并将所
需文件转换成 ISO 9660 格式;对 CD—R 映象进行仿真;将映象写入 CD—R, 建立目录表(TOC);将写入数据与写入前数据进行比较。
目前,常用的预制作与制作软件有 CD—GEN、WinOn- CD、EasyCDpro、
CDWRITE、Personal Scribe 等。有些软件是与写入器一起提供的,也有单独 出售的。
四、可重写光盘与可重写光盘机
1.可重写光盘类型
(1)相变型可擦写光盘。
自 1983 年日本 National 公司展出第一台可重写相变型视频光盘以来, 真正拉开了可重写光盘的序幕。此后又于 1989 年开发成功可直接重写的 3.5 英寸相变光盘,其单面容量达 280MB,采用分离式光头,平均存取时间小于
54.5 毫秒。
利用晶态和非晶态两种状态表示数据的 1 和 0,而利用两者之间的相转 变,来达到可擦重写的目的。读、写、擦过程如下:将高功率和窄脉宽的激 光束聚焦到薄膜上,Insb 基化合物或碲基化合物介质吸热后迅速升温至熔点 并在聚冷条件下形成非晶态,由于晶态和非晶态材料的折射率与周围区域有 明显反差,用小功率激光束可检出此反射率的差异,这就是读出过程。擦除 过程则是用较长脉宽和较低功率的激光束作用于记录点,使该点温度上升到 低于材料的熔点而高于非晶态的转变温度,使介质产生重结晶而恢复成多晶 状态。这种擦、写、读过程所需的时间与激光束的功率、材料温升速率等有 关。近年来大量研究工作都是围绕着降低擦除时间(加快晶化速度),提高 晶态和非晶态的反衬度以及材料稳定性等方面进行的。
目前单束光可重写的相变型光盘已实用化。如采用波长为 680 纳米光头,
实现 1.2 微米的窄道宽,密度比原来提高 2 倍。3.5 英寸相变光盘容量为
600MB,与目前 5.25 英寸磁光盘相当。日立公司不久前也报道了其容量达
16OMB 的 2.5 英寸相变型光盘驱动器,其装置厚度仅 15 毫米。 相变光盘的传输速率受晶相转变速度的影响,但它可在双面介质上采用 单光束直接重写。由于这一特点,相变光盘不仅整体容量大(双面可重写),
而且具有向下兼容的特点,这就是所谓的多功能光盘驱动器,这种多功能光 盘驱动器,能兼容相变可重写和一次写入光盘盘片的 CD—ROM 信息,所以仍 受到用户的青睐。
(2)磁光型可擦写光盘。
可擦重写磁光盘系统于 1988 年正式推出,一问世即呈供不应求之势,发 展极为迅速。磁光型光盘的读写方式分磁场调制和激光调制两种。所用介质 为稀土—过渡金属(Re—Tm)非晶态合金。磁场调制方式是在恒定功率激光 照射下,介质的温度升至居里温度(Tc)或补偿温度(Tcom),光头中磁场 线圈的调制信号使磁场反向磁化,在写入激光束很快离开聚焦点后产生某一 方向的磁化区域。光调制则是在恒定磁场作用下,通过调制激光脉冲信号来 改写数据的。信息的读出是利用磁光克尔效应。信息的擦除过程与写入方法 相同,把磁化方向又反转过来。相对于相变型光盘而言,磁光型的光头部分 增加了磁场线圈,即增加了光头复杂程度。但是由于磁光记录材料的寿命相 对较高,状态也较稳定,制备过程容易控制,因此目前情况下,厂家更多地 选择了磁光型可重写光盘。
同相变光盘一样,为了保持向下兼容,也开发了多功能的磁光盘驱动器,
HP、Sony 和 Maxtor 三家公司均安装这种能处理可重写和一次写入两种介质 的多功能驱动器。最近又有消息报道,松下电器产业公司试制成了可对磁光 盘记录/再生的 3.5 英寸相变光盘装置。这种光盘装置实际上是磁光盘驱动 器,但附加了可对相变光盘记录再生的电路。利用盘盒上的写保护孔,判别 介质是磁光盘还是相变光盘,若是相变光盘,则首先将转速从 3000rpm 降至
1800rpm,以便使用同一激光源(35 毫伏)对相变介质进行写/读。据称,若
能加大或改变激光器功率则转速可以不变。这种情况,一方面反映了多功能 光盘的发展趋势,另一方面说明即使是最早生产相变光盘的松下公司,也已 介入磁光这个领域。
相变光盘最显著的特点是:①可实现直接重写;②信号电平比磁光盘的
高,因而信噪比高;③不需磁场元件,因而光头结构简单,重量轻,易实现 集成化,可提高伺服跟踪精度和数据传输率。但是相变光盘介质的稳定性及 重写循环次数还不够理想。磁光型技术成熟,主要也是体现在磁光介质方面, 擦写循环次数超过 106 次,工作寿命在 15 年以上。为了实现与相变光盘的竞 争,磁光盘的直接重写技术、分离光头技术等,也在进一步研究之中。总之, 可重写光盘正朝着大容量小型化方向高速度发展。
2.可重写光盘机
与可重写光盘相对应,可重写光盘机目前主要有相变型(P—C)和磁光 型(M—O)两种形式,相变型光盘具有直接盖写能力,而早期的磁光盘则一 般要先擦、后写、再校,即先转一圈抹去原来的数据,再转第二圈写入新数 据,第三圈进行校验。但目前很多公司已开发出可直接重写的磁光盘驱动器, 采用双光头三光束技术,在转一圈内完成擦除、写入、读出校验三项工作。 可重写光盘机因其可直接重写的特殊性,故可作为计算机硬盘的后备存储器
或二次存储装置,甚至还可作为个人机或网络服务器、工作站上具有可换性 的一级存储器。随着技术进步,生产批量的增大,其价格会不断下降。另外, 值得一提的是多功能光盘驱动器,这种驱动器可以读写 WORM 介质和可重写介 质。目前多功能光盘机的类型较多,有的可以同时使用一种 WORM 介质和 MO 介质,也有的可使用相变 WORM 盘和相变可改写盘,National 公司还推出了
3.5 英寸磁光、相变两用盘等等。多功能驱动器把两种驱动器的功能组合在 一起,从而降低了制造成本和销售价格,同时用户可通过一台光盘驱动器进 行多种应用,而不需要把单独的 WORM 驱动器和可重写驱动器一起挂在系统 上。多功能光盘机除可作为二次存储装置使用外,还可在 CAD/ CAM/CAI、数 据采集、医疗卫生、金融事务处理等方面得到广泛应用。
第六章 多媒体个人计算机
一、多媒体计算机技术的概念及体系结构
具有多媒体功能的计算机被称为多媒体计算机,其中最广泛、最基本的 是多媒体个人计算机(Multinedia PeraonalComputer,简称 MPC)。具备多 媒体功能的计算机系统即是多媒体计算机系统。
多媒体计算机系统的结构如下图所示:
(1)计算机硬件。是多媒体系统的基础,包括计算机及附属声卡、视卡、 CDROM 等;多媒体计算机硬件及板级产品多媒体计算机要能综合处理声、文、 图信息、必须解决下述四个问题:①视频和音频信息的获取问题;②视频和 音频信息的压缩和解压缩问题;③视频和音频信息的实时处理和特技;④视 频信息的显示和音频信息立体声输出。这是建立多媒体计算机硬件支撑平台 必须具备的功能,尤其是视频和音频信息的输入和输出以及压缩和解压缩功 能,一定要用硬件板卡实现。
(2)多媒体信息的压缩与解压缩。一般多媒体信息需要巨大的存储空
间,所以在处理这些信息时要对他们进行压缩,而且要求压缩的速度极快, 一般这个层次都是在芯片中实现。而且整个 IC 界对压缩与解压缩规定了许多 的标准;
(3)输入/输出控制或接口。包括对多媒体硬件设备的驱动、控制和软
件调用规定;
(4)多媒体核心系统。也就是多媒体操作系统,它是界于操作系统与上 层软件之间的系统,负责多媒体信息在操作系统与应用软件之间的处理;
(5)创作系统。是为开发者提供的开发工具程序包,一般创作系统除编
辑多媒体的工具外,还有播放功能。多媒体创作系统的设计目标是缩短多媒 体应用软件的制作开发时间,降低对制作人员素质的要求,多媒体编辑工具 可分成下述三类:高档编辑工具:适合电影、电视系统专业编辑工具;中档 编辑工具:适合教材、娱乐系统的制作编辑;低档编辑工具:适用于商业介 绍资料、简报及家庭学习材料的编辑。目前世界上比较流行的,在 Windows 平台上运行的编辑工具有:Macromedia 公司的 Authorware Professional、 Aimech 公司的 Icon Author,Asymetrix 公司推出的 Multimedia ToolBook, MacroMedia 公司推出的 Action 等。
(6)应用系统。就是最终与用户见面诩诩如生的各类软件。多媒体应用 系统利用多媒体数据库和多媒体编辑工具,可以方便、迅速地编制出极有效 益的多媒体应用系统。如多媒体办公自动化系统;多媒体工程数据库系统; 多媒体人事档案管理系统;多媒体地理管理系统;各种电子出版物。
二、MPC 标准
由于多媒体计算机技术是因实际需要而产生发展起来的,最初各厂商都 独自生产自己的多媒体产品,现在市场上也存在多种不同标准的多媒体集成 一体机或多媒体集成系统,著名的有 MPC 标准、Apple 公司的 Macintosh 系
统(其操作系统是 System 7.0,数字视频平台为 Quick Time)、Corm—modore 公司的 Amiga 系统(其多媒体描述语言为 AmigaVision)、Philips/Sony 公 司开发的 CD—1 系统(其操作系统是 CD—RTOS,Compact Disk Real Time Operating System)、In- tel/IBM 公司合作开发的 DVI 系统(其核心是 AVSS,
即 An- dio/Video Support System)和 AVK,即 Audio/VideoKernel)等。 但其中发展最快、得到大部分厂商支持的是 MPC 标准。
世界几家较大的多媒体计算机厂商,包括 Microsoft,IBM,Philips,NEC 等于 1990 年成立了多媒体计算机市场协会(Multimedia PC Marketing Council,INC),以进行多媒体标准的制定和管理,该组织制定的标准即是 MPC(MultimediaPC,多媒体个人计算机)标准。1991 年该组织根据当时的
PC 机发展水平制定了多媒体 PC 机的基本标准即 MPC 标准,对多媒体 PC 机及 相应的多媒体硬件规定了必需的技术规格,要求所有使用 MPC 标志的多媒体 产品都必须符合该标准的要求。随着计算机和多媒体产品性能的不断提高, 多媒体计算机市场协会 1993 年 5 月对 MPC 标准中的大部分规定进行了更新, 发布了多媒体 PC 机的新标准,即 MPC2 标准,原来的 MPC 标准被称为 MPC1 标准。
现在,计算机和多媒体产品有了进一步的发展,更名为多媒体 PC 机工作 组(The Multimedia PC Working Group)的多媒体计算机市场协会 1995 年
6 月份公布了最新的多媒体 PC 机标准,即 MPC3 标准。
MPC1 标准规定了 PC 机多媒体的基本要求,提供了多媒体 PC 机的基本框 架;MPC2 更新了 MPC1,进一步扩展了多媒体 PC 机的结构,使多媒体计算机 技术逐步标准化;MPC3 并不是用以替换 MPC2 的,它只是对多媒体 PC 机的表 现能力有了更高的要求,为多媒体技术的广阔应用打开了大门。
三、MPC 的发展趋势
未来的 MPC 除了在多媒体功能上不断加强外,还会朝着如下三个方面发 展。
1.一体化,即向多媒体一体机方向发展
所谓多媒体一体机(Moniputer),简单地说,就是显示器加上 PC 再加 上多媒体,当然并不是 MPC 加个显示器套在一个外壳里就可称为一体机。除 了外形的一体化以外,一体机的设计与普通台式机的差别在于,Moniputer 是显示器和电脑主机一体成型的“模组化”电脑,不仅符合人体工程学的原 理,而且结构简洁,安装容易,即插即用。
早期的多媒体电脑,大多是在电脑整机基础上加装多媒体硬件,使之具 备多媒体功能。由于功能的不断加强和提升,不同厂商不同规格的多媒体部 件堆在一部机器上,不仅破坏了 PC 原本的简洁美观,也造成了使用、维护和 功能上的麻烦与损失。因此,当一些知名 PC 厂商开始推出自己的 MPC 品牌时, 一体成型也成了一种趋势。
最早的是 1993 年由 PC 界的龙头老大(当时还不是)Compaq 公司推出的 Presario 。目前,我们在市场上可以见到 的一体化的 MPC 有: IBMAptiva2168X/Y/240、CompaqPre- sario5522、IPC 万智能及 AcerAspire 等。
从市场的角度看,多媒体电脑的很大市场在家庭,至少厂商是期望以此 打破电脑进入家庭的瓶颈,而一体化的 MPC 正好可以从多方面满足家庭的需
用:简洁美观、占用空间小、易装易用,如同家里的彩电或音响一样。我们 注意到,Apple 电脑多年来在美国及全球家用电脑市场上经久不衰,Apple 电脑从 AppleⅡ到 Pertorma,十多年来均保持着一样的简洁美观,两者之间 恐怕有某种必然的联系吧。可以想见,由 MPC 的市场特点,将会有更多的一 体机问世,并成为 MPC 的主流。
2.网络与通信功能成为标准配置
虽然无论是 MPC1、MPC2 还是 MPC3,都没有将网络与通信方面的要求列 入,但是眼下可见的 MPC,很多都具有网络与通信的功能,并且在宣传时都 竭力突出这方面的能力。Fax/Modem 及网络通信软件已经成了 MPC 不可缺少 的基本配置。
这种现象与电脑发展的大趋势是一致的。我们处在一个网络时代,今天 我们已能感到网络无所不在,明天我们将会感到,我们无时不在网络之中, 由于网络的普及,对于各类信息来源(本地的或远程的)、多种信息类型(数 字的或模拟的)及多种信息载体(语音的、数据的、图形的、图像的、视频 的等)的信息的获取、存储、转发、处理,就成为电脑的一个很重要的甚至 是核心的任务。
由于多媒体计算机大多用于家庭,如何引起消费者的购买热情是一个关 键。一年多以前,多媒体热是由于 VCD 影碟的大量流行,如今影碟的热劲已 经退去,新的热点在哪儿,厂商显然看好网络,特别是因特网的兴起。尽管 国内因特网的用户还很少,而且其发展也受到诸多方面的影响,但因特网连 入千家万户似乎是不可逆转的潮流。在这情况下,多媒体电脑自然都要标榜 有网络与通信功能,以争取用户的青睐。由于因特网给人们带来信息获取方 式的全面改变,深深地改变着人们的生活方式和工作模式,因此,应该说把 因特网作为卖点,比看几张影碟对人们更有持久的吸引力。方正卓越多媒体 电脑提出,使其卓越电脑成为信息处理中心,显然比单纯的娱乐中心更具远 见。
随着网络技术的飞速发展和网络建设的快速推进,未来家用电脑的主流
是简单便宜的网络电脑(NC),还是功能更强大的个人电脑(PC),目前是 仁者见仁、智者见智,看不出个眉目。但依笔者之见,NC 也许更合适的市场 在学校、银行或公司,此外功能单一的网络电脑也不符合中国人的消费习惯。 结合了网络功能的多媒体电脑应该是未来中国家庭购买电脑时的首选品种。 当上因特网、有自己的 Email 地址,不再是身份与地位的象征,当网上 购物、远程医疗、视频点播等成为人们生活中的一部分时,网络与通信功能
对于 MPC 来说,显然是不可缺少的。
3.家电化的趋势
多媒体电脑的家电化趋势也很明显,因为家庭是它的主要市场。无论从 销售渠道还是从电脑功能的设置以及外观、使用等方面,多媒体电脑还会继 续呈现家电化的趋势。但是,这里有一个问题,电脑毕竟还不同于一般的家 用电器,过份的家电化倾向可能达不到预期的目的——被家庭接受。某个品 牌的多媒体电脑几乎无所不包的家电功能,市场上反响并不热烈。也许纯粹 家电化的应该是多媒体电视,而不是多媒体电脑。
第七章 多媒体软件
多媒体软件是多媒体技术的核心。多媒体软件必须运行于多媒体系统之 中,才能发挥其多媒体功效。多媒体软件综合了利用计算机处理各种媒体的 新技术,如数据压缩、数据采样等等,能灵活地高度运用多媒体数据,使各 种媒体硬件和谐协调地工作,使多媒体系统形象逼真地传播和处理信息。多 媒体软件的主要功能是让用户有效地组织和运转多媒体数据。
多媒体软件大致可分成四类:
(1)支持多媒体的操作系统;
(2)多媒体数据准备软件;
(3)多媒体编辑软件;
(4)多媒体应用软件。 以下分别予以介绍。
一、多媒体操作系统
操作系统是计算机的核心,它控制计算机的硬件和其它软件的协调运 行,管理计算机的资源。因此,它在众多的软件中占有特殊重要的地位,它 是最基本的系统软件。所有其它系统软件都是建立在操作系统的基础上的。 操作系统具有两大功能:首先是通过资源管理提高计算机系统的效率,
即通过 CPU 管理、存储管理、设备管理和文件管理,对各种资源进行合理的
调度与分配改善资源的共享和利用状况最大限度地发挥计算机的效率。其 次,改善人—机界面向用户提供友好的工作环境。操作系统是用户与计算机 之间的接口。窗口系统是图形用户界面的主体和基础。窗口系统是控制位映 象、色彩、字体、光标、图形资源及输入设备。
MS—Window3.0 版上已开发了许多多媒体应用软件,它和 Macintoh
Tooolbox 成为多媒体应用的主要支持软件。Windows3.1 提供了多媒体支持和 目标连接嵌入等功能,是 PC 机上开发多媒体的最佳环境。
为多媒体而设计的操作系统(OS),要求易于扩充,数据存取与格式无
关,面向对象的(object—Oriented)结构,能同步数据流,用户界面直观。 例如,Microsoft 公司用 WME(win- dows Multimedia Extensions,即 Windows 的多媒体扩充版),这是在 OS 的层次上支持和增设的多媒体功能。
在 Windows 下,应用程序先同 MMSYSTEM 对话,再由后者推动低层多媒体
设备驱动程序某个 MCI 驱动程序。
Windows 的 MCI(Media Control Interface 的缩写,媒体控制接口)可 直接控制硬件。对 Windows MCI 的命令包括:MCI—PLAY,MCI—RECORD 及 MCI
—STATUS。Windows 多媒体设备驱动程序执行为各类多媒体设备规定的标准 功能,例如打开和关闭设备,发送和接收缓冲的连续波数据或单个的 MIDI 信息,设备的音量等。
二、多媒体数据准备软件
多媒体数据准备软件主要包括数字化声音的录制、编辑软件;MIDI 文件 的录制、编辑软件;全动视频片段的录制;图像的获取。
1.数字化声音的录制、软件
Creative Wavestudio——该软件支持多文档接口(MDI)和下拉菜单及
鼠标操作,它能从多种声源录音并将它们混合控制。编辑命令有:剪裁、贴 进、回声、淡化、放大和反向等。在硬件许可条件下,录制声音进可选择立 体声、单道声。
Creative Soundo*LE——该软件录下的声音文件能采用 OLE 技术插入到 任何 Windows 文件中。可以在多个输入源中选择进行录音,在硬件许可的条 件下可选择声音压缩方法,可选择立体声或单声道,8 位或是 16 位采样强度,
11 或 22 或 44kHz 采样频率。获取的数据直接写入硬盘,录音时间(长度) 不受内存大小的限制。
2.录制、编辑 MIDI 文件的软件
Creative Apprentice for Windows——这是一个对用户友好的图形 MIDI 音序器。用户在不同的形式下观看多个控制图标并编辑 MIDI 音序:钢琴滚 筒、五线谱或事件表。用鼠标可以描述速度变化、调整力度或细调弯音。在 重放音乐时改变音色分配或改变速度。此外,还能控制数字声音卡,使之与 MIDI 音序同步。
3.从视频源中获得图像的软件
Creative Video Kit——该软件是随 Creative Video Blaster 发行的静 态图像定格获取软件,其主要功能特点:
(1)帧捕获
(2)活动/静态视频缩放
(3)输入声音的软件调节
4.录制、编辑全动视频片段的软件
Microsoft Video for Windows——这是一套根据 Win- dows 的全动视频 的获取及编辑,并能把获取的 AVI 格式的全动视频片段通过 Windows OLE 技 术嵌入到任何的 Win- dows 实用软件。
三、多媒体编辑软件
多媒体编辑软件又称为多媒体创作工具,它的主要作用是支持应用开发 者从事创作多媒体应用软件。
1.功能
一套实用的多媒体编辑软件,应具备以下功能:
(1)编程环境。提供编排各种媒体数据的环境,能对媒体元素进行基本 的信息控制操作,包括循环分支、变量等价及计算机管理等。此外,还具有 一定的串处理、定时、动态文件输入/输出等功能。
(2)媒体元素间动态触发。所谓动态触发是指用一个静态媒体元素(如 文字图表、图标甚至屏幕上定义的某一区域)去激活一个动作或跳转到一个 相关的数据单元。在跳转时用户应能设置空间标记,以便能返回起跳点。
多媒体应用经常要用到原有的各种媒体的数据或引入新的媒体,这就要 求多媒体编辑软件具有输入和处理各种媒体数据的能力。
(3)动画。能通过程序控制来移动媒体元素(位图、文字等),能制作 和播放动画。制作或播放动画时,应能通过程序调节物体的清晰度、速度及 运动方向。此外,还应具有图形、路径编辑,各种动画过渡特技(如淡入淡 出、渐隐渐现、划入划出、透视分层等)等能力。
(4)应用程序间的动态连接。能够把外面的应用控制程序与用户自己创 作的软件连接,能由一个多媒体应用程序激发另一个应用程序,为其加载数
据文件,然后返回第一个应用程序。更高的要求是能进行程序间通信的热连 接(如动态数据交换),或另一对象的连接嵌入。
(5)制作片段的模块化和面向对象化。多媒体编辑软件应能让用编成的 独立片段模块化,甚至目标化,使其能“封装”和“继承”,使用户能在需 要时独立取用。
(6)具有良好的扩拓性。多媒体编辑软件能兼顾尽可能多的标准,具有 尽可能大的兼容性和扩充性。此外,性能价格比较高。
(7)设计合理,容易使用。应随附有详细的文档教材,这些材料应描述 编程方法,媒体、输入过程,应用示例及完整的功能检索。
由上述可见,多媒体编辑软件的基本思想是将程序的“底层”操作模块 化。例如,用户只需输入图像文件名称和显示坐标即可通过“显示模块”在 屏幕上显示图像出来。如果在显示图像时,需要有伴音,则只需再引入一个 音频播放的模块。这样,用户在上机时尽可能不借助印刷文档而掌握软件的 基本使用方法。这不仅提高了多媒体软件创作的效率,而且为大批非计算机 工作者进入这个领域提供了方便。
多媒体编辑软件应设计成操作简便、编辑时易于修改、菜单布局合理。
2.常用的多媒体编辑软件
此处重点讨论在 PC MS—window 版本上运行的多媒体编辑软件。
(1)Authorware Professional。该软件以 Windows 作为操作环境,系 统采用 Objectauthoring 框架,以 ICON 方式来编辑程序,能编排各种类型的 多媒体数据,能任意地中断流程以供编辑或执行。
该软件由英国 Authorware 公司推出,用于交互或教育培训。它的创作环
境是由多个图符组成了一种图符界面:Dis- play,Animator,Erase,Wait, Decision,Interaction,Calculla- tion,Map,Movie,Soud,Video。这 些图符小,只有黑白色,但功能十分强大。通过选择这些图符可构成应用程 序结构的流程图。每个图符都有多种功能,例如,Calculation 图符可用于 完成教学计算,管理系统变量,还可用于调用包括用户定义过程在内的特殊 函数,或跳到其它文件或应用程序上。此外,Calculation 图符还有记录功 能,可记录用户的正确答案次数及回答次数,从而判断用户的学习状况。
Authorware Profession 容易学会,无需编程,便于操作,它是开发教育
方面多媒体应用项目的一种较好的编辑软件。
(2)IconAuthor——这是运行在 Windows 环境下的一套包括开发全特征 多媒体应用软件所需全部工具的多媒体编辑软件。它主要用于教育培训、信 息咨询领域。它提供图形流程图模式,50 个设计精美的图标位于屏幕左边, 表示所有功能。
(3)Multimedia Toolbook。这是一套用来编辑全特征多媒体应用程序 的多媒体编辑软件。它是一个面向对象的开发环境,它并不是专为多媒体应 用开发而设计的,但它提供的 openscript 语言容易为初学者掌握,因而制作 多媒体软件比较方便。它可提供预先编好程序的图形对象,可以用 Windows 的剪贴功能将图形放在自己的程序之中,加以控制 CD—LD 等设备;它可提供 多媒体屏幕原形。
Toolbook 在多媒体 Windows 支持下连接各种多媒体设备,包括影像迭加 设备、视频磁盘、录像机等,它可支持声音及音乐等媒体,通过 MCI 命令串 在播放后可触发事件。
Toolbook 可显示外办存储的位图文件,并嵌入到多媒体应用中。
四、多媒体应用软件
这是多媒体开发者利用媒体编辑工具组织编排大量的多媒体数据而成为 多媒体的最终产品。
多媒体应用软件的 6 个阶段制作流程如下:
(1)成立研制组确定主题目标,组织人员分工。如美工设计、剧本编写
(包括音频和视频剧本)程序设计人员(进行多媒体应用编程)、媒体制作 人员(准备录音室、电视制作室等,获取声音、图像的文件,准备对音像媒 体元素进行必要的加工)。
(2)编写剧本。按照主题要求,收集、整理、组织有关的资料,拟定大 纲,编写成剧本,加旁白说明。
(3)数据准备。这个阶段是文字、声音、图像、图形等生成阶段。
①设计出分镜脚本,并生成相应的文本文件。
②用创作、转录、效果等方式产生音乐。
③旁白说明的录制及速度控制。
④把收集的图片输入计算机。
⑤采集编辑全动视频片断。
(4)利用多媒体编辑软件制作。数据准备完成后,便可按照剧本在编辑 软件指导下,组织编排数据,形成产品,完成多媒体应用软件的开发。
(5)请计算机专家进行程序加工,完善编辑软件。
(6)产品评审。组织专家评议审定。通过软件的演示和报告,审查是否 达到预期目的,进行必要的调整和修正。
目前,我国有一些企业已经开发了几种的多媒体应用软件,例如,通用
多媒体图像/图形编辑处理软件系统等。立足国内跟踪国际发展,根据市场需 要,开发各种媒体应用软件,以实现中国特色的多媒体技术产业化。
第八章 多媒体信息检索服务
一、多媒体信息检索服务及其构成
多媒体与超媒体信息检索系统是一种人机交互系统,也是多媒体通信系 统中一个十分重要的分支。由于多媒体通信系统是一个全新的课题,因而出 现了一批新的术语。为便于正确了解这些术语的含义,现将其中最主要的术 语解释如下:
·超媒体(Hypermedia)——通过外部树形的链(Hy- perlink)将多种 类型的媒体连成一个集合,这个集合称超媒体。
·脚本(Script)——描述一个显示或输入对象中各对象间关系(包括 相关对象间的时空关系、同步)的技术规范。
·脚本软件(Scriptware)——实现脚本的软件。
1.多媒体信息检索服务的系统结构
(1)信息提供者。信息提供者是多媒体信息检索服务的重要组成部分。 它是多媒体和超媒体检索系统中的全部信息的产生者。是它们将多媒体信息 产生出来,并以一定规则传送出去。
信息提供者的三个最基本的要求是:①有编辑多媒体与超媒体信息的能 力;②可向数据库上载它产生的多媒体和超媒体信息,并有能力修改数据库;
③可向下加载检索途径(Trace)。
(2)信息库。多媒体信息检索服务系统中,全部信息是存放在信息库中 的。由于多媒体与超媒体信息的特殊性,其库结构也将是特殊的,特别是需 要从硬盘中大量读取信息的场合。因而,需要特殊算法来满足需要。
信息库的三个基本要求是:①可存储多媒体与超媒体信息;②能通过交
互检索已存储的 M&H 信息;③能接收信息提供者的上载数据。
(3)信息系统管理者。多媒体信息检索服务系统是个很复杂的系统,它 不是一个简单的点对点通信,因而在系统中将有一个信息管理者存在。
信息管理者的最基本要求是:①管理多媒体和超媒体信息;②管理多媒
体和超媒体信息目录;③管理系统用户;④向上装载已处理的检索过程;⑤ 向下装载未处理的检索过程;⑥计费;⑦接入控制;⑧保护;⑨系统监测。
(4)信息系统用户。多媒体和超媒体信息检索系统的用户是系统信息的
实际消费者,它受信息管理者管理并接入系统,通过多种途径来检索所需信 息。
信息消费者的最基本要求是:①查阅多媒体和超媒体信息目录,查看系
统的有效信息;②根据有效的信息目录来检索多媒体与超媒体信息;③下载 和修改多媒体与超媒体信息;④多媒体与超媒体信息的远程查询;⑤上载未 处理的检索过程。
2.多媒体信息检索服务的网络拓扑结构
多媒体信息检索服务可有三种典型的网络拓扑结构。
(1)点对点。这是一种常用的拓扑结构,用户终端与数据库是点对点连 接。引伸开去,在这种结构中也包含多个用户对一个数据库主机的量形连接。 由于在这种网络拓扑结构中,一个用户只能查一个数据库,因而这种拓扑结 构适用于专网信息系统。
(2)一点对多点。在这种拓扑结构中,一个用户可接续多个数据库主机, 因而也可查找多个数据库的信息资源,这是一种适用于公共网信息系统的网
络拓扑结构。在这种拓扑结构中,有一点要强调指出的,这里对不同数据库 的路由选择是由终端来实现的(或由终端用户来实现),因而系统中数据库 的增减需及时通知全部用户,否则将产生系统对多点的网络拓扑结构差错。
(3)一点对多点(通过接入点设备)。在这种网络拓扑结构中,一个用 户可接续多个数据库主机,因而也可查找多个数据库的信息资源,这也是一 种适用于公共网信息系统的网络拓扑结构。与上一种不同之处是,它增加了 一个接入点设备(AP),因而从性能上就大大优于前一种方式了。由于在网 络中增加了接入点设备,它将负责对系统中数据库的管理,这样对不同数据 库的路由选择已不是用户终端(或用户)的事,而是由接入点设备来自动完 成。系统中数据库的增减只需在接入点处登记,而无须通知所有用户;另外, 接入点设备还实现对用户终端的控制和管理。因而与上一个网络拓扑结构相 比,这一种结构更为实用。
3.多媒体信息检索服务系统处理的信息
(1)内容数据信息。内容数据信息是用单一媒体的编码标准来表示的信 息。它包括文本、二维和三维图形、静止图像、二值图像、声音和活动图像。
(2)多媒体和超媒体信息。多媒体和超媒体对象可用它们在实时交换环 境下的适当标准来进行表示和编码,它用到单媒体的一些表示标准。多媒体 和超媒体表示信息的标准,至少必须拥有下列特点:①在表示对象之间可有 不同的时间同步算法;②具有表示对象间的空间复合的能力和机制;③可以
用 Hyperlink 去引用外部的表示信息;④可以定义用户的不同输入请求;⑤
定义对象间的链接,例如事件(Event)和作用(Action)的链接;⑥描述与 对象相联系的题目信息,详细说明它是如何在用户面前显现的;⑦提供一种 可引用内容或将这些内容包含在 MH 对象之中的机制。
(3)脚本信息。脚本信息将选用一些合用的标准来编码和表示。它将用
单媒体信息的编码标准和 MH 信息的编码标准。脚本信息是一组特定的用语义 关系联系起来的结构化的 MHI(多媒体和超媒体信息)。它需要提供这一组 多媒体信息的运作过程及与外部处理模块间的关系。
脚本信息至少需具备如下特点:①能控制对结构的操作;②宣布全局控
制事件;③复杂的定时操作;④MHI 对象的表示;⑤外部处理机的调用;⑥ 库函数的调用;⑦定义校核点及从校核点的恢复功能。
(4)特定的应用信息。上面所述的信息是三类低层的信息,可以由标准
来定义和表示。第四类信息是高层信息,它是与应用密切相关的,它将随应 用场合的不同而有很大的不同。它不像前三类信息那样有一般性的表示方 法,它的表示方法是基于上三类的基础之上的。
一个重要的例子是,最终用户工作站执行了 Scriptware 后,产生的返回 踪迹(Trace)是随着不同的应用场合而不同的。另一个常用的典型例子是目 录(号码簿)信息,通过目录信息可检索到所需的多媒体或超媒体信息,因 而目录信息是按照信息类型的不同(如:文档、对象、文件、文本、数据包 等)来分类的,并用内在关系互相联系起来。这样,用户就可以在检索所需 信息前,先利用目录信息来找到所需信息位置。目录信息就是典型的特定应 用信息。
二、多媒体信息检索服务标准及信息交换
1.多媒体信息检索服务的国际标准和工业标准
国际电联 CCITT 和国际标准化组织 ISO 在多媒体信息检索服务领域已经 进行了大量的标准化工作,现在已有一批建议可供使用。另外,在多媒体的 开发中,一些工业发达国家为本身设备的开发也制定了一些工业标准。鉴于 这些标准已经广泛使用,因而很可能在今后的国际标准化中被采用。所以, 在多媒体和超媒体信息检索服务系统的研究中,国际标准和工业标准都是值 得重视的。下面将围绕多媒体信息检索服务的国际标准和工业标准进行讨 论。
(1)单媒体内容数据信息
①文本 文本含有三方面内容:符号、符号的字型和字体、在数据传送和操作管
理中的符号编码。已有的国际标准有:ISO646;CCITTT.51、T.52、T.61、T.101。 目前还有一个新的国际标准正在制定之中,这就是 ISO10646,它基本上是一
个 16bit 编码结构。该国际标准将把世界上所有的编码表都纳入统一的编码 结构之中。
在已有文本的工业标准中,最著名的是 ASCII 码,这是美国的国家标准, 另外还有 CDA 和 RTF 等。
②图形 图形编码一般有如下几种方法:①镶嵌图形法;②动态再定义图形;③
几何图形法;④增量。关于图形编码的国际标准有:CCITTT.101 建议(可视
图文的表示层句法,定义了全部图形编码方法);CCITTT.105 建议(关于增 量编码的建议);ISODP8632(CGM);ISO7942(GKS);ISO9637(CGI)。 工业标准有:WMF;DXF;PICT;PostScript。
③二值图像与静止图像
静止图像是与时间无关的相片图像,是颜色、色饱和度、强度连续变化 的二维相片。
其国际标准有:CCITTT.4、T.6;CCITTT.81;CCITT- T.82;ISODIS11544;
ISODIS10918. 工业标准有:GIF;PCX;DIB;TIFF;IFF;JPG。
④声音
语音编码技术国际标准绝大部分都是 CCITT 提出的。Rec.G.711 描述了
8kHz 抽样、8bit 量化的语音编码;Rec.G.721 描述了低速率、低质量的语音 编码;G.722 则是高码率、高质量的语音编码。在 MPEG 中也有语音编码,通 常被称为 MPEGAudio,它的编码率为 8~32kB/s。MPEG Au- dio 算法也用于 数字式盒式录音机和数字式语言广播,它采用的是子带编码压缩技术,因而 能获得低的码速和高的语音质量。另外还有 T.101 的 AnuexE.ODA 将声音引入 了文件体系结构中去。在工业界大多数采用 PCM 和 ADPCM 技术。
⑤运动图像 运动图像指的是人们所能见到的活动图像(如电视、电影、录像等)。
在运动图像方面的国际标准最主要的是:CCIT- TH.261;ISO11172(MPEG)。 它们均是基于 DCT 变换的压缩编码技术。H.261 是用于点对点实时通信的场 合,在可视电话和会议电视场合都采用 H.261. 其数据速率为 P*
64kbit/s.MPEG 是用于存储读出系统(如信息检索系统、录像机、数字电视 等),而不是用于实时点对点通信,其原因是 MPEG 算法将引入固有时延。MPEG1 是家用录象机质量级的压缩运动图像编码,其最高码速为 1.5Mbit/s,这个
速度与光盘(CDROM)的读出速度是相适配的(150KB/s)。MPEG2 是高质量 的运动图像编码(如 HDTV),最高编码速率为 40Mbit/s。MPEG 还正在致力 于研究低速率的运动图像编码(希望能达 10kbit/s)。除上述两种主要的国 际标准外,在其他场合还可用 JPEG。虽然说 JPEG 是专门为静止图像编码而 研究的,但也可用于运动图像编码。
工业标准有:CD1;DVI,DVI 使用了两种编码格式:RTV、PLV;Macromind
和 Animotor 是动画的工业标准。
(2)多媒体和超媒体信息 近年来,开始对多媒体和超媒体对象的表示和编码进行标准化。对多媒
体和超媒体对象的表示和编码涉及到以下内容:
·对单媒体数据或多媒体对象的引用和嵌入。
·时间同步和空间同步。
·项目信息(Projector):项目信息指的是与内容有关的显示属性信息。 譬如对声音内容的信息来说,它的项目信息指的是音量、声道等属性信息。
·演奏方式(Rendition)信息:演奏方式信息指的是一类与媒体直接相 关的信息。譬如对时基(Timebase)媒体来说,可以有“速率设置”的 Rendition 信息;对可见(Visible)媒体来说,可以有“尺寸选择和设置”的 Rendition 信息。
·将单媒体(Content)信息聚焦和复合起来,构成多媒体对象的方法。
·多媒体对象间的超级链(对象间用链接关系链起来)。
·输入信息(客户与系统的交互)等。 目前,多媒体和超媒体对象的表示和编码已有多种,最具代表性的是
MHEG;HyTime;Hyper ODA;MPEG 等。
①MHEG
MHEG 是 ISO/IECJTCI/SC29/WG12 和 CCITTSG8/
Q11 组成的联合工作组的研究成果。该标准是用于实时交换的多媒体和超 媒体信息对象的表示法。
②HyTime
HyTime 是 ISO/IECJTC1/SC18/WG8 的工作成果。Hy- Time 主要研究的有: 多媒体同步的表示,超媒体在文档内或文档间的链接。HyTime 适用于综合的 开放型多媒体和超媒体信息系统,以及在开放环境下的文档交换和操作管 理。
HyTime 标准的最近版本是 1992 年版,标准号是 DIS- ISO10744。HyTime
与 MHEG 在很多方面是一致的,但它们的使用方法和应用环境是不同的。涉及 到文档的处理和交换可用 HyTime,涉及到对象的处理与交换则是用 MHEG。Hy- Time 从标准的设计角度出发,试图用于枢纽间的信息交换,而不是专门用于 实时信息交换。
③HyperODA 与 ODA
HyperODA 与 ODA 是 ISO/IECJTC1/SC18/WG3 和 CCITTSG8/Q27 的成果。 HyperODA 与 ODA 主要是用于文档的交换与操作管理。HyperODA 是一种围绕的 体系结构(外部元素必须根据 ODA 标准化),仅限于 ODA 环境下的文档交换。 ODA,即开放文件体系结构,是用于交换文件的描述方法。ODA 不支持多媒体 信息的处理与交换,但可以在 ODA 的内容(Content)中引用其他方式编码的 多媒体信息。Hyper- ODA 是基于 ODA 的,但能处理和表示多媒体和超媒体信
息。
④其他标准
包括 MPEG 和 MPEG1(ISO11172)。MPEG1 定义了在 MPEG 中交织的数据码 流(图像、语音和文本)的帧结构,这是一种表示时间同步特性的信息表示 法。当然,这种表示法本质上是线性的,只适用于表示比较简单的信息,主 要用于表示运动图像及与其相关联的声音数据。在 MPEG 的帧结构中,还保留 了若干比特供文本交互用。
⑤工业标准
·RIFF:是包在其他格式文件外的一种包封结构,在 RIFF 的标记上,标 有分量的类别和尺寸。这些被 RIFF 包起来的分量,则是用独立有效的常用的 文件格式来表示。
·MCI:提供一种高层的命令接口(API),用于多媒体系统的源文件中, 它使用的编码格式为 RIFF。
·Quicktime:用来描述并行的媒体数据流和它们之间的同步。Quicktime 是将多媒体与格式化的 Movie 环境相联系的描述方法。还有专门用于 PC 的 Hypertext、Hypermedia 等格式,但都是专用的,无交换能力。
(3)脚本层
这由 ISO/IECJTC1/SC18CCITTSG1/Q17 和ISO/ IECJTC1/SC29CCITTSG8/Q9 研究,至今尚无国际标准。
工业标准有:HyperCard、Toolbook 和 Scriptx。它们都使用了能够表示
超级结构(Hyperstructure)的通用编程语言作为通用的 Script 语言。
2.信息交换
从显示的观点,信息交换(Information Interchange)可分为两大类: 一类为实时信息交换,另一类为非实时信息交换。
(1)实时信息交换
实时信息交换指的是边传输边进行显示的一种信息交换方式。实时信息 交换的国际标准有:CCITTT.170 建议;CCITTT.175 建议;CCITTT.176 建议; CCITTT.41X 建议;CCITTT.43X 建议。
在 T.170 建议中,描述 AVI 中的某些业务需要,并定义了“Ⅰ”、“Ⅱ”、
“Ⅲ”、“A”和“B”五种接口。
T.175 建议描述“Ⅰ”接口(从信息消费者到主机),它包括文件传送、 选择、浏览、远程执行等。
T.176 建议描述“B”接口,这是一个实时信息交换的协议,它覆盖了 MHI
的 RTI。
协议“A”为应用层协议,目前已有 ContentData 的 RTI 的“A”协议。 这些协议有:T.102、T.103、T.105、T.43x 和 T.41x。
一个重要的工业标准是 X.11.X.11 是本地(局域)网络客户/服务器
(Client/Server)协议,用于图形和窗口信息。
(2)非实时信息交换 非实时信息交换指的是,终端必须等到一个单元的信息(文件或数据库
记录)完全传送完毕后,才能显示的一种信息交换方式。非实时信息交换的 标准有:FTAM;RDA;DFR;DTAM.FTAM 从本质上来说,只能操作和传送完整 的文件,然而,对其他类文件,它也可操作和传送其中的一个对象,并且还 能对文件的存储执行某些管理功能。RDA 提供从数据库中将其中一项(如,
一条记录)传送出去。这个标准分为多个部分:首先,它定义了通用的服务 和协议;其次,分别为不同的数据库体系结构和数据库操作管理作了专门的 定义。目前,只有一个专门定义已完成,这就是 SQL 数据库语言。当然,今 后还将发展另外的数据库语言和组织。特别是存储对象结构的文本数据库将 会用 SGML 来描述。
DFR 很像 FTAM 和 RDA,但只能用于文档操作。文档由其属性来描述,属 性的用法与 ODA 相近。DTAM 是用于存取和操作管理 ODA 文档的。
三、多媒体信息检索服务硬件技术
1.终端设备
用于多媒体信息检索服务的终端,既可以用通用的计算机,也可以用专 用的终端设备。
(1)总线。 在多媒体设备中,除中央处理器(CPU)外,还需辅助以特殊处理器,这
些处理器通过总线和附加的控制器将内存储器和外部设备连接起来。由于总 线速度受限而制约了设备的性能,目前解决的办法是采用局部总线。
大多数个人计算机和工作站都提供扩展槽,扩展卡可插入这些槽中与系 统总线相连接。由于不同的计算机平台有不同的总线系统,因而一般来说, 扩展卡不具有通用性。
(2)本地存储。
本地存储指的是计算机或工作站的本机存储,一般有四类:工作存储器
(RAM)、外部永久性存储器(硬盘)、备份存储器(磁带)、可移动式存储 器(软盘、CDROM、可拆卸式硬盘)。
对存储器的要求为:存取时间/寻道时间;读写时间;存储容量;可移动
性;可写性:存取/编码和文件结构;模拟存储。
(3)多媒体的显现。 多媒体的显示输出与用户的感官要求密不可分。因此,在研究多媒体的
显现硬件设备时,首先需研究一下,用户感觉对不同媒体的显现要求和限制。
首先讨论视觉的限制,根据实验可知,人的视觉分辨率为 1/120 度,这 相应于在一个人的正常视距内,屏幕上分辨力 380dpi(点数/英寸)。从目 前或将来可及的技术来看,视频显示器只能达到上述分辨率的 1/10。人眼对 亮度的辨别率为 240~300 级灰度,而且人眼对不同颜色的分辨率是不相同 的。目前采用的 24bit 量化(红、绿、蓝各 8bit,分别有 256 种灰度)是与 人眼适配的。在大多数场合下,色彩比分辨率更重要。
再来讨论人耳的听觉。正常人的耳朵可以分辨出 80db 强度的变化(16bit 可以表示 96db 的动态范围)。人耳的感知频率为 20Hz~20kHz。根据纳奎斯 特抽样定律,抽样频率必须大于 2 倍的最高频率,因此对音质要求很高的场 合(能覆盖人耳感知频率的全程),抽样频率为 44.1kHz,对每个抽样进行
16bit 量化。对于立体声来说还分左、右 2 个声道,这样未压缩的数字化立 体声的码率为 44.1*4KB/s。在研究了图像和语言的显现问题后,下面来讨论 现有多媒体的硬件设备。
①显示器:现有的显示器为:640*480,768*512,800*600,1024*768,
1024*1024,24bit 量化(RGB 各 8bit)。它们在显示卡上各自带的存储器容 量为 900、1152、1406、2304 和 3720KB。为了减少存储容量,通常用调色板
法(262114 种选择,共有 1680 百万种颜色)来显现 256 种颜色。也有 RGB
各 5bit 量化,可直接表示 32768 种颜色。
②声音:为了避免混叠,抽样频率应为所需最高频率的 2 倍。语音编码 器采用的压缩编码算法通常有:PCM、DPCM、ADPCM 和线性预测编码(LPC) 等。
③目前市场上已有的声音卡:Multi Sound Board;ProAu-dio Spectrum; Mpc Audio One;Sound Blaster Pro。
④静止图像的硬件有:JPEG Board;i750;Kodak PhotoCD。
⑤视频卡有:C Cude;CD1;DVI;JPEG Decoders。
(4)目前与多媒体接口的软件平台有 Microsoft Win-dows、Macintosh
System、Xwindow System。
2.网络环境
(1)FDDI
FDDI 是以令牌协议为基础的高速局域网,其速度为 100Mbit/s。
(2)MAN(MetropolitanAreaNetwork)
MAN 网是用于填充局域网和公用广域网之间的空白,这类网络的 IEEE 标 准是 DQDB。
(3)ISDN
ISDN 是一种广域网,它提供两种接入类型:基本接入速率为 2B+D;一次 群接入速率为 30B+D。另外还有: HO 信道( 384kbit/s);H11 信道
(1536kbit/s);H12 信道(1920kbit/ s)。
(4)BISDN
BISDN 即宽带 ISDN,它采用的是 ATM 规程,速率可达 155Mbit/s。
(5)其他
其他网还有 PSTN、DBN(DigitalBroadcastingNetwork)等。
3.主机
多媒体信息检索服务对主机的要求很高,最主要有如下三方面:向多用 户传送大量的实时数据;主机有很大的存储容量;有相应强的计算能力。
这里值得一提的是主机的硬盘速度,因为在多媒体信息检索服务中硬盘
的存取速度往往是系统的瓶颈,它需要与通信网的通信速率相匹配。在目前, 如工作在一次群 NISDN 环境下(30B+D1920kbit/s),与目前硬盘的存取速率
(8Mbit/s)是基本适配的,不至于成为瓶颈。当通信环境进入 BISDN,通信
速率将达 155Mbit/s,那么硬盘的存取速率在 200Mbit/s 以上才能适配。有 幸的是,据预测,硬盘在 10 年内可望达到这个存取速率。
四、多媒体可视图文系统
多媒体可视图文系统是一种远程多媒体信息检索系统,它通过公用分组 交换网、局域网和数字数据网将分布在不同地域的多媒体信息源组织起来, 通过电话网、综合业务数字网和用户专线向广大用户提供多媒体信息服务。 它是一种公用的开放型的信息服务系统。多媒体可视图文系统是现在业已进 行商业运行的可视图文业务网的升级系统,它对现有系统是向下兼容的。它
是 90 年代初国际上刚完成标准化的最新一代的多媒体远程信息检索系统。 多媒体可视图文系统由用户终端设备、多媒体可视图文接入点设备、多 媒体信息数据库和业务管理中心四大部分组成,为了与其他网相连构成广域
的高速信息环境,从而获得更多的信息,网内还有三类设备:专用集线器
(HUB)与 ATM 相连、路由器与其他局域网相连、网关与因特网相连。 用户终端是用户与系统的接口,用户是通过用户终端接入到系统中去,
并通过用户终端获取多媒体信息。多媒体可视图文系统中用户终端有三种: 一种是电话网上的用户终端,用户终端通过电话网与系统相连,其通信速率
为 14.4kB/s;第二种是综合业务数字网上的用户终端,它通过电话线与综合 业务数字网的交换机相连,其通信速率为 128kB/s;第三种是专线接入终端, 它通过专线直接和系统相连,其通信速率是 64kB/s。尽管这三种用户终端的 接入方式不同,接入速率也不同,其得到的服务则是相同的。它的人机界面
为 Windows 界面,因而可以提供复杂的人机交互方式来获得真彩色的静止照 片、无失真的二值图片、手绘真迹图形和文字、各种图表、曲线和文字,还 有声音和合成音乐。终端所得到的声、文、图信息是以同步方式经多通道向 用户提供的。
多媒体可视图文接入点设备是系统中的核心设备,它实现对用户终端的 管理、对数据库的路由寻找、计费、统计等功能。它还要与业务管理中心进 行通信,接受业务管理中心的各项管理命令,并向业务管理中心报告状态信 息。多媒体可视图文接入点设备提供五种网络接口,其中三种网络接口是面 向用户的,这三种网络接口是:电话网通信接口(通信速率为 14.4kB/s)、 综合业务数字网通信接口(通信速率为 D=16kB/s,2B=144kB/s)和专线用户 接口(通信速率为 64kB/s)。另外两种网络接口是面向数据库的,这两种网 络接口是:分组网通信接口(通信速率为 64kB/s),它主要是用于和文本数 据库、脚本数据库以及业已运行的所有可视图文数据库相连,以获取信息; 局域网通信接口(通信速率为 10MB/s),它主要是用于和图像数据库、声音 数据库相连,还可以通过专用集线器与 ATM 交换系统相连,或通过网关与因 特网相接以提供宽带广域通路。
多媒体可视图文数据库有四类,一类为文本数据库,这类数据库与现在
已经运行着的可视图文数据库没有本质上的不同,不同之处在于它提供超级 文本链接,它主要是提供文字和简单图形信息内容;第二类数据库为脚本数 据库。这是一类很特殊的数据库,它主要是为了能实现声、文、图同步而专 门设计的数据库;第三类数据库是图像数据库和复合对象数据库,它存放经 过压缩的彩色图像、不失真二值图像等信息。这是面向对象的数据库,它还 存放复合的多媒体对象信息;第四类数据库是声音和音乐数据库,它存放经 过压缩的声音和音乐,它也是面向对象的数据库。多媒体可视图文系统中, 声、文、图是分别存放在不同的数据库中,在终端程序的调度下,经由不同 的信息通道,由数据库将数据信息传送给终端,这些信息在终端同步起来, 向用户提供多媒体信息服务。
业务管理中心是实行全网业务管理的,多媒体可视图文系统是一种业务 统一管理、计费统一管理的集中式管理信息系统。业务统一管理指的是数据 库的登记、删除、系统中数据库目录的编制是统一管理的。信息系统的业务 统一管理给用户的使用带来极大方便,用户对在网的信息资源,可从多媒体 接入点设备提供的数据库目录中一览无遗,网中接入点设备的数据库目录正 是业务管理中心编制并下载下来的。业务管理中心除了实现全网业务管理 外,还对全网的接入点设备进行监控.并向全网采集统计信息,从而确保全网 的服务质量。
多媒体可视图文系统中的网关是专门为因特网设置的,多媒体可视图文 终端用户通过网关进入因特网获取信息,并可和因特网用户交换信息。
多媒体可视图文系统是严格遵循国际标准来实现的。在通信系统中,国 际标准化是很重要的。多媒体可视图文系统是现有可视图文系统从通信业务 层次上向高技术发展的延续。因而在现有可视图文系统中应用的全部国际标 准,在多媒体可视图文系统中将全部采用。此外,在多媒体可视图文系统中 还采用了如下一些国际标准。
1.增强型可视图文人机接口(VEMMI)
可视图文系统中,用户终端与系统的界面是简单的问答式交互界面,用 户终端可采用基于 DOS 的接口方式。在多媒体可视图文系统中,人与系统的 接口大大复杂化了,必须使用 Windows 的人机接口方式,国际电联提出的 VEMMI 协议就是这样的一种人机接口。要指出的是,Windows 是 PC 机本机的 人机接口,而 VEMMI 则是一种具有 Windows 接口功能、终端与远地数据库之 间的人机接口协议,这是一个很复杂的协议,多媒体可视图文系统中实现了 这一协议。
2.多媒体可视图文系统的应用层协议
多媒体可视图文系统中,用户终端与系统中信息流的交互再不会是简单 的单一信息流,而是多种信息流的工作状态。根据脚本中对信息流的安排, 或者复合对象中各种不同信息流间的关系,多种信息流的开发工作情况是要 考虑的。多媒体可视图文的应用层协议正是针对此来设计的。它除了有一条 主信道外,还可有若干与主信道同时工作的辅助信道,它们可以用于同时传 送文本、语音、音乐和图像信息。多媒体可视图文系统中采用了这一建议并 实现了它。
3.多媒体可视图文系统中的表示层句法
多媒体可视图文系统是一种资源受限的通信系统,即通信速率受限和终 端存储量受限。为了要在资源受限的通信系统中有很好的效率和很好的服务 质量,系统中大量采用先进、高效的编码技术,如文本、图形编码继续沿用 可视图文表示层句法;曲线采用区域增量编码技术,这是 ISO 和 ITUT 两大国 际标准化组织从最优的六种增量编码方案中优化出来的,它对手写真迹文本 有最佳的压缩效率;二值图像采用 JBIG 算法,这是基于自适应算术编码算法 基础之上,是目前最佳二值图像压缩算法;彩色静止图像采用 JPEG 算法,这 是基于离散余弦变换(DCT)算法,理论已经证明,DCT 是仅次于卡一洛变换 的准最佳算法,加之它有快速算法,因此是目前国际标准化了的一种很好的 算法;声音采用两种压缩编码算法,其符合 ITUTT.101 建议 AnnexE,码率为
8kb/s 和 16kb/s 两种语音;音乐采用 MIDI 编码,这是一种合成音乐。由于 通信信道速率受限,没有引入运动图像的压缩编码算法。
4.多媒体可视图文系统中的同步
同步是多媒体通信系统中的一个极为重要的特征。在多媒体通信系统 中,同步可以在三个层面上实现,这三个层面分别为:帧级、表示层级和应 用层级。多媒体可视图文系统中不引入运动图像,因而没有帧级层面的同步。 它在应用层级进行了同步,即应用脚本技术来实现的;它在表示层级进行了 同步,这一同步是在构成复合对象时引入时间同步和空间同步机构来实现 的。
5.多媒体可视图文系统中的超文本技术多媒体可视图文系统中,大
成为本站VIP会员VIP会员登录,
若未注册,请点击免费注册VIP 成为本站会员.
版权声明:本站所有电子书均来自互联网。如果您发现有任何侵犯您权益的情况,请立即和我们联系,我们会及时作相关处理。