第2章 多媒体数据压缩编码技术:
2.1 概述:
音/视频编码所采用的基本技术都是相同的,但由于视频的数据量比音频大得多,压缩起来更困难,因此在讨论中人们通常以视频为例。
音/视频编码方法的分类没有统一的标准,从不同的角度出发有不同的分类方法。
一种分类方法是从编码后信息是否有损失出发,可以分为有损编码和无损编码。有损编码是一种失真编码,它在压缩过程中会损失部分信息熵,即以丢失部分有用信息为代价来获得相应的压缩效果。无损编码也称为熵编码或信息保持��码,这种方法尽量去除图像中的冗余度,保证不丢失其中的任何有用信息,使得解码后可以不失真地恢复原来的图像内容。常见的熵编码有哈夫曼编码、算术编码和游程编码等。
另一种分类方法是按照压缩编码技术所依据和使用的数学理论和计算方法,可以分为统计编码、预测编码、变换编码和量化编码等。统计编码是基于信号统计特性的编码方法,是一种无损编码。预测编码利用邻近像素之间的相关性,根据当前编码像素值和预测值得出预测误差,再对预测误差进行编码。变换编码通过适当的坐标旋转和变换,把原始数据变换到新的坐标系中,使这些数据集中在少数新坐标上,减少各坐标变量之间的相关性,使得变换后的能量集中在少数系数上。量化编码是将具有连续幅度值的输入信号转换到只具有有限个幅度值的输出信号的过程。
还有一种分类方法是按照信源模型,可以分为基于波形编码和基于内容编码两类。基于波形编码方法是基于率一失真理论的,在这类方法中,图像序列利用在空间上和时间上取样得到的一组像素来表示,声音利用在时间上对波形取样的一系列样值来表示,然后采用一般信号分析方法来消除数据中的冗余。这类方法只是了解信源的统计特性,而不关心图像的具体内容和人类的视觉特性,所以称为**代图像压缩编码技术。前面所述的熵编码、变换编码和预测编码以及结合变换编码和预测编码的混合编码都属于此类。基于内容编码方法根据人类的视觉特性,把图像分割成许多不同对象并独立编码这些对象的运动、纹理和形状信息,称为第二代图像压缩编码技术。
……