基于小波变换的图像数据压缩 第3页
一般在图象中局部区域的象素是高度相关的,因此可以用先前的象素的有关灰度知识来对当前象素的灰度进行预计,这就是预测。而所谓内插就是根据先前的和后来的象素的灰度知识来推断当前象素的灰度情况。如果预测和内插是正确的,则不必对每一个象素的灰度都进行压缩,而是把预测值与实际象素值之间的差值经过熵编码后发送到接收端。在接收端通过预测值加差值信号来重建原象素。
预测编码可以获得比较高的编码质量,并且实现起来比较简单,因而被广泛地应用于图象压缩编码系统。但是它的压缩比并不高,而且精确的预测有赖于图象特性的大量的先验知识,并且必须作大量的非线性运算,因此一般不单独使用,而是与其它方法结合起来使用。如在JPEG中,使用了预测编码技术对DCT直流系数进行编码,而对交流系数则使用量化+游程编码+霍夫曼编码。
5、矢量量化编码
矢量量化编码利用相邻图象数据间的高度相关性,将输入图象数据序列分组,每一组m个数据构成一个m维矢量,一起进行编码,即一次量化多个点。根据仙农率失真理论,对于无记忆信源,矢量量化编码总是优于标量量化编码。
编码前,先通过大量样本的训练或学习或自组织特征映射神经网络方法,得到一系列的标准图象模式,每一个图象模式就称为码字或码矢,这些码字或码矢合在一起称为码书,码书实际上就是数据库。输入图象块按照一定的方式形成一个输入矢量。编码时用这个输入矢量与码书中的所有码字计算距离,找到距离最近的码字,即找到最佳匹配图象块。输出其索引(地址)作为编码结果。解码过程与之相反,根据编码结果中的索引从码书中找到索引对应的码字(该码书必须与编码时使用的码书一致),构成解码结果。由此可知,矢量量化编码是有损编码。目前使用较多的矢量量化编码方案主要是随机型矢量量化,包括变换域矢量量化,有限状态矢量量化,地址矢量量化,波形增益矢量量化,分类矢量量化及预测矢量量化等。
6、变换编码
变换编码就是将图象光强矩阵(时域信号)变换到系数空间(频域信号)上进行处理的方法。在空间上具有强相关的信号,反映在频域上是某些特定的区域内能量常常被集中在一起,或者是系数矩阵的分布具有某些规律。我们可以利用这些规律在频域上减少量化比特数,达到压缩的目的。由于正交变换的变换矩阵是可逆的且逆矩阵与转置矩阵相等,这就使解码运算是有解的且运算方便,因此运算矩阵总是选用正交变换来做。
常用的变换编码有K-L变换编码和DCT编码。K-L变换编码在压缩比上优于DCT编码,但其运算量大且没有快速算法,因此实际应用中广泛采用DCT编码。
7、模型法编码
预测编码、矢量量化编码以及变换编码都属于波形编码,其理论基础是信号理论和信息论;其出发点是将图象信号看作不规则的统计信号,从象素之间的相关性这一图象信号统计模型出发设计编码器。而模型编码则是利用计算机视觉和计算机图形学的知识对图象信号的分析与合成。
模型编码将图象信号看作三维世界中的目标和景物投影到二维平面的产物,而对这一产物的评价是由人类视觉系统的特性决定的。模型编码的关键是对特定的图象建立模型,并根据这个模型确定图象中景物的特征参数,如运动参数、形状参数等。解码时则根据参数和已知模型用图象合成技术重建图象。由于编码的对象是特征参数,而不是原始图象,因此有可能实现比较大的压缩比。模型编码引入的误差主要是人眼视觉不太敏感的几何失真,因此重建图象非常自然和逼真。
1.3 图像压缩方法分类
从技术上看,图像压缩的途径有两种,一是通过减少图像中各象素相关产生的冗余来减少待传输或存储的数据总量,例如利用离散余弦变换(DCT)减少数据间的相关性,然后保留其中的主要分量,从而减少数据量。二是根据数据动态范围及其出现的频繁程度,确定适当的编码方案,通过适当安排不同数据所占编码比特数,来减少所需总比特数达到压缩的目的。
数据压缩技术有多种不同的分类方法。一种是按照压缩过程的可逆性进行分类,可分为熵压缩(Entropy Compression)和冗余度压缩(Redundancy Reduction)两种。熵压缩是所谓的不可逆压缩,即在压缩过程中,会失掉一部分信息,因此熵压缩又称为有损压缩,它是以丢掉部分信息为代价而获得相应的压缩效果的。当然,为确保还原后的数据能基本保持原数据的特征,这种丢弃部分信息造成的失真,应限制在某个规定的范围之内;从另一角度讲,这种把失真限制在某一允许限度内,可使图像编码达到更高压缩比的压缩编码,又称为率失真编码或限失真编码。熵压缩技术主要用于图像和语音数据压缩。冗余度压缩是可逆压缩,冗余度压缩的机理是完全或尽量除去原数据中冗余的部分,而保证不丢失其中的任何信息,从而被压缩了的数据还原后与压缩前的数据完全一致。因此,可逆压缩又称为无失真压缩,这种压缩编码方法主要用于文本、程序文件等不允许出现任何数据失真的场合。
常见的图像文件:
MPEG-运动图像压缩编码
MPEG(Moving Pictures Experts Group)标准分成两个阶段:第一个阶段(MPEG-I)是针对传输速率为 lMb/s到l.5Mb/s的普通电视质量的视频信号的压缩;第二个阶段(MPEG-2)目标则是对每秒30帧的720x572分辨率的视频信号进行压缩;在扩展模式下,MPEG-2可以对分辨率达1440Xl152高清晰度电视(HDTV)的信号进行压缩。但是MPEG压缩算法复杂、计算量大,其实现一般要专门的硬件支持。
MPEG视频压缩算法中包含两种基本技术:一种是基于l6x16子块的运动补偿技术,用来减少帧序列的时域冗余;另一种是基于DCT的压缩,用于减少帧序列的空域冗余,在帧内压缩及帧间预测中均使用了DCT变换。运动补偿算法是当前视频图像压缩技术中使用最普遍的方法之一。
PCX-是历史最悠久的图像文件格式。采用RLE(行程长度编码)压缩原理。
BMP-WINDOWS的基本图像文件格式。图像数据处理方式有压缩和不压缩两种,压缩方式采用的也是RLE压缩原理。
GIF-采用LZW压缩原理为基础压缩图像数据,能够有效的压缩文件容量。
TIFF-排版和图像扫描仪常用的图像文件格式。其文件内部运用指针功能,建立了一个开放式的架构,可以包含多种不同的识别信息和压缩方式。JPEG就是其中的一种。
JPEG算法:JPEG是Joint Picture ExpertGroup的缩写,即联合图像专家组。JPEG算法中首先对图像进行分块处理,再对每一块进行二维离散余弦变换(DCT),变换后的系数基本不相关,且系数矩阵的能量集中在低频区,通过保留低频部分系数,去掉高频部分系数,从而达到压缩目的。余弦变换是经典谱分析的工具,它考察的是整个时域过程的频域特征,或者整个频域过程的时域特征,该算法具有较强的块内去相关能力,适于较平坦块的压缩。它的缺点是没有利用图像中局域间的相关特性,在压缩倍数高时,恢复图像出现明显的方块效应。
JPEG2000:JPEG2000是由ISO/IEC JTC1 SC29标准化小组负责制定的全新静止图像压缩标准。一个最大改进是它采用小波变换代替了余弦变换。小波变换是现代谱分析工具,它既能考察局部时域过程的频域特征,又能考察
上一页 [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] ... 下一页 >>