语音信号μ/A律压缩的DSP软件实现(英文文献+中期报告+源代码+流程图) 第12页
2.1 现代语音信号压缩编码的基本方法
数字通信技术是现代信息传输的重要手段。在数字通信系统中,信源端的数据要先进行编码,然后通过数字传输系统才能发送到信宿端。信源编码包括模拟信号的数字化和信源压缩编码两个范畴,而语音、图像等多媒体数据中都存在各种各样的冗余,在进行数字通信时,为了保证通信的有效性,必须进行压缩处理[6]。现在数字语音压缩编码可用于语音存储,例如留言电话、语音信箱等场合。数码率越低,一定容量存储媒质如RAM、硬盘可存储的语音信息越多。语音压缩倍率越高、数码率越低、编码算法也越复杂,而且大多数的应用场合又要求实时压缩,不可能用逻辑电路实现,也不可能用体积大、速度慢的微机实现,只有采用DSP方能做到实时编解码。
波形编码,是指经过数学编码和解码过程后重建的模拟信号波形与原始的模拟信号波形尽可能一致的编码方法。在波形编码中一个重要的问题是在给定的编码速率下如何获得最高的SNR的问题。波形编码有对数PCM编码,自适应增量调制(ADM)编码,自适应差分PCM编码,子带编码等;其中对数PCM编码和ADPCM编码应用最为普遍。此次设计语音信号采用PCM编码方式,使用DSP芯片可以直接对PCM编码后的语音信号进行μ/A律压缩。
2.2 PCM脉冲编码调制原理
脉冲编码调制是一种将模拟语音信号变换成数字信号的编码方式[2],其概念是1937年由法国工程师Alec Reeres最早提出来的[1]。20世纪70年代后期,超大规模集成电路的PCM编、解码器的出现,使PCM在光纤通信、数字微波通信和卫星通信中获得了更广泛的应用。因此,PCM已成为数字通信中一个十分基础的问题。PCM主要包括抽样、量化和编码三个过程。线性PCM是指模拟语音信号经过采样、幅度量化和二进制编码后,由解码器作数/模变换后再由低通滤波器恢复出现原始的模拟语音波形。它未经过任何另外的编码和压缩处理,其编码目标是让解码器恢复出的模拟信号在波形上尽量与编码前原始波形相一致,即失真要最小。
PCM是一种依据语音信号幅度统计特性,在系统的发送端将语音幅度按对数变换压缩后作为编码,在接收端将编码按指数扩展,从而获得还原语音,完成语音高效传输的一种语音编码方法。通常采用的两种对数PCM,分别为A律对数PCM和μ律对数PCM。对数PCM提出较早,随着技术的进步,各种低码率编码方式不断涌现。但迄今为止,对数PCM的平均判分(MOS)高达4.3的语音传输性能,仍是其他低码率语音编码方式无法比拟的,因而它仍极为广泛地应用于数字通信、数字交换机等大型通用数字传输设备及众多语音数字化接口中。我们在某些小型专用数字传输设备例如电子语音报站器、语音采集前端等的设计中,由于对语音质量要求较高,但系统外部可扩展存储空间有限,需对系统初始化数据或对运行后所得结果进行压缩存储、传输、解压缩等操作。因此,可将对数PCM编码方法应用于各种小型专用语音数字传输设备的数据处理。
CCITT的64kbit/s语音编码标准G.711采用的就是PCM编码方式,采样速率为8kHz,每个样值用8bit非线性的μ律或A律进行编码,总速率为64kbit/s。
语音编码调制过程中,将未考虑音量大小出现的概率、仅对输入信号的取值域按等距离分割的量化称为均匀量化;即每个量化阶Δ均为常数,如图2-1所示。反之,根据语音信号低音量出现概率较高、高音量出现概率较低的特性,量化过程要产生量化误差,Δ越小、量化级数越多、信噪比越高,但数码率也增高,降低了传输效率。从语音信号的振幅特性观察,小幅度出现误差的概率大,大幅度则概率小。为此提出了非均匀量化的概念,使量化器在小信号范围时Δ小,随着幅度的增大,Δ也相应加大。通常使用的非均匀量化压缩器中,大多数采用对数式压缩,非均匀量化器的转移特性如图2-2所示。
图2-1 线性量化特性
图2-2 非均匀量化器的转移特性
2.3 A律压缩原理
μ/A压缩解压编码是国际电报电话协会(CCITT)最早推出的G.711语音压缩解压编码的一种格式的主要内容。其中欧洲和中国等国家采用A律压缩解压编码,美国和日本等国家采用μ律压缩解压编码,由于中国采用A律,所以该毕业设计主要研究用A律压缩解压算法实现语音信号的压缩。
常见的二进制码组有3种,即自然二进制码组、折叠二进制码组和格雷二进制码组。当信道传输中有误码时,折叠码由此产生的失真误差功率最小,因此PCM标准中采用了折叠二进制码。在现在的简单语音压缩中按CCITTG.711标准采用A律压扩特性的量化器[10],设输入信号为x,输出信号为y,则A律压扩特性用下列函数来描述: (2-1) (2-2)
式中:y为归一化的压缩器输出电压;x为归一化的压缩器输入电压;A为压扩参数,表示压缩的程度。在语音压缩的过程中,通常并不直接利用式(2-1)求取压缩值,往往都采用近似于A律函数规律的13折线的压扩特性[3]。我国采用的13折线编码与A=87.6的A律编码拟合得非常好。在13折线法中,无论输入信号是正是负,均按8段折线(8个段落)进行编码。其具体方法是:将x坐标从0到1之间划分为8个不均匀段,先将0-1之间二等分,取1/2-1作为第8段;剩余的0-1/2再二等分,取1/4-1/2为第7段;依次分割7次,直至分出最后0-1/128作为第1段。将y轴的0-1均匀等分为8段,与x轴的8段对应。各点相连即得由8段直线构成的一条折线。上述讨论为第1象限内的折线形状。第3象限内有与之以原点为中心的奇对称的另一部分,故整条折线由16条线段组成。由于正向第1、第2段和负向第1、第2段的斜率相同,实为一条线段,故正、负双向的折线总共由13条线段构成,故称其为13折线。13折线特性如图2-3所
<< 上一页 [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] 下一页