1.4 数字视频基础

1.4.1 视频基础

所谓视频,即由一系列单独的静止图像组成,每秒钟连续播放静止图像,利用人眼的视觉残留现象,在观者眼中产生的平滑而连续活动的影像。

帧:一帧是扫描获得的一幅完整图像的模拟信号,是视频图像的最小单位。

帧率:每秒钟扫描多少帧。对于PAL制式电视系统,帧率为25帧;而NTSC制式电视系统,帧率为30帧。

场:视频的一个扫描过程,有逐行扫描和隔行扫描。对于逐行扫描,一帧即是一个垂直扫描场;对于隔行扫描,一帧由奇数场和偶数场两行构成,用两个隔行扫描场表示一帧。

1.4.2 电视制式简介

电视的制式就是电视信号的标准。它的区分主要在帧频、分辨率、信号带宽、载频以及色彩空间的转换关系上。不同制式的电视机只能接收和处理相应制式的电视信号,但现在也出现了多制式或全制式的电视机,为处理不同制式的电视信号提供了极大的方便。全制式电视机可以在各个国家(地区)使用。目前各个国家(地区)的电视制式并不统一,全世界目前有三种电视制式。

PAL制式

PAL制式即逐行倒相正交平衡调幅制。它是德国在1962年制定的彩色电视广播标准,它克服了NTSC制式色彩失真的缺点。根据不同的参数细节,它又可以分为G、I、D等制式。

NTSC制式(N制)

NTSC制式是由美国国家电视标准委员会于1952年制定的彩色广播标准,它采用正交平衡调幅技术(正交平衡调幅制)。NTSC制式有色彩失真的缺陷。

SECAM制式

SECAM是法文“顺序传送彩色信号与存储恢复彩色信号制”的缩写,由法国在1956年提出、1966年制定的一种新的彩色电视制式。它克服了NTSC制式相位失真的缺点,采用时间分隔法来逐行依次传送两个色差信号。

1.4.3 视频时间码

一段视频片段的持续时间、开始帧和结束帧通常用时间单位和地址来计算,这些时间和地址被称为时间码(简称时码)。时间码用来识别和记录视频数据流中的每一帧,从一段视频的起始帧到终止帧,每一帧都有一个唯一的时间码地址,这样在编辑时利用它可以准确地在素材上定位出某一帧的位置,以方便安排编辑和实现视频和音频的同步。这种同步方式叫作帧同步。“动画和电视工程师协会”采用的时间码标准为SMPTE,其格式为小时:分钟:秒:帧,如一个PAL制式的素材片段表示为0:01:30:13,即它持续1分30秒13帧,换算成帧单位就是2263帧,如果播放的帧速率为25fps,那么这段素材可以播放约1分90.5秒。

电影、电视行业中使用的帧率各不相同,但它们都有各自对应的SMPTE标准,如PAL采用25帧/秒或24帧/秒,NTSC制式采用30帧/秒或29.97帧/秒。早期黑白电视采用29.97帧/秒而非30帧/秒,这样就会产生一个问题,即在时间码与实际播放之间产生0.1%的误差。为了解决这个问题,设计出了帧同步技术,这样可以保证时间码与实际播放时间一致。与帧同步格式对应的是帧不同步格式,它会忽略时间码与实际播放帧之间的误差。

1.4.4 压缩编码的种类

视频压缩是视频输出工作中不可缺少的一部分,由于计算机硬件和网络传输速率的限制,视频在存储或传输时会出现文件过大的情况,为了避免这种情况,在输出文件的时候就会选择合适的方式对文件进行压缩,这样才能很好地解决传输和存储时出现的问题。压缩就是将视频文件的数据信息通过特殊的方式进行重组或删除来达到减小文件大小的过程。压缩可以分为以下几种方式。

有损和无损压缩:在视频压缩中有损(Lossy )和无损(Lossless)的概念与静态图像中基本类似。无损压缩也即压缩前和解压缩后的数据完全一致。多数的无损压缩都采用RLE行程编码算法。有损压缩意味着解压缩后的数据与压缩前的数据不一致。在压缩的过程中要丢失一些人眼和人耳所不敏感的图像或音频信息,而且丢失的信息不可恢复。

帧内和帧间压缩:帧内(Intraframe)压缩也称为空间压缩(Spatial compression)。当压缩一帧图像时,仅考虑本帧的数据而不考虑相邻帧之间的冗余信息,这实际上与静态图像压缩类似。帧内一般采用有损压缩算法,帧内压缩一般达不到很高的压缩;帧间压缩也称为时间压缩(Temporal compression),它通过比较时间轴上不同帧之间的数据进行压缩。帧间压缩一般是无损的。

对称和不对称编码:对称性(symmetric)是压缩编码的一个关键特征。对称意味着压缩和解压缩占用相同的计算处理能力和时间,对称算法适合于实时压缩和传送视频,如视频会议应用就以采用对称的压缩编码算法为好。而在电子出版和其他多媒体应用中,一般是把视频预先压缩处理好,然后再播放,因此可以采用不对称(asymmetric)编码。不对称或非对称意味着压缩时需要花费大量的处理能力和时间,而解压缩时则能较好地实时回放。一般地说,压缩一段视频的时间比回放(解压缩)该视频的时间要多得多。

1.4.5 压缩编码的方式

压缩不是单纯地为了减小文件,而是要在保证画面的同时来达到减小文件大小的目的,不能只管压缩而不计损失,要根据文件的类别选择合适的压缩方式,这样才能更好地达到压缩的目的,常用的视频和音频压缩方式有以下几种。

Microsoft Video 1

这种方式针对模拟视频信号进行压缩,是一种有损压缩方式,支持8位或16位的影像深度,适用于Windows平台。

Intellndeo(R)Video R3.2

这种方式适合制作在CD-ROM上播放的24位的数字电影,和Microsoft Video 1相比,它能得到更高的压缩比和质量,以及更快的回放速度。

DivX MPEG-4(Fast-Motion) 和DivX MPEG-4(Low-Motion)

这两种压缩方式是Premiere Pro增加的算法,压缩基于DivX播放的视频文件。

Cinepak Codec by Radius

这种压缩方式可以压缩彩色或黑白图像,适合压缩24位的视频信号,制作用于CD-ROM播放或网上发布的文件。和其他压缩方式相比,利用它可以获得更高的压缩比和更快的回放速度,但压缩速度较慢,而且只适用于Windows平台。

Microsoft RLE

这种方式适合压缩具有大面积色块的影像素材,如动画或计算机合成图像等。它使用RLE (run length encoding)方式进行压缩,是一种无损压缩方案,适用于Windows平台。

Intel Indeo 5.10

这种方式适合于所有基于MMX技术或Pentium II以上处理器的计算机。它具有快速的压缩选项,并可以灵活设置关键帧,具有很好的回放效果;适用于Windows平台,作品适合网上发布。

MPEG

在非线性编辑时最常用的是MJPEG算法,即Motion JPEG。它将视频信号50场/秒(PAL制式)变为25帧/秒,然后按照25帧/秒的速度使用JPEG算法对每一帧进行压缩。通常压缩倍数在3.5~5倍时可以达到Betacam的图像质量。MPEG算法适用于动态视频的压缩,除了对单幅图像进行编码外还利用图像序列中的相关原则,将冗余去掉,这样可以大大提高视频的压缩比。 目前MPEG-I用于VCD节目中,MPEG-II用于VOD、DVD节目中。

其他还有很多方式,如Planar RGB、Cinepak、Graphics、Motion JPEG A和Motion JPEG B、DV NTSC和DV PAL、Sorenson、Photo-JPEG、H.263、Animation及None等。