音频压缩编码概述

音频压缩编码概述什么是音频信号人耳听觉系统三特性音频编码技术概览波形编码参数编码混合编码感知编码什么是音频信号通常，将人耳可以听到的信号，叫做音频信号(20Hz-20kHz)。人的发声器官能产生的频段在80-3400Hz左右。正常人说话的语音频段在300-3000Hz左右。人耳听觉系统三特性人耳对不同频率的灵敏度不同。在2-5KHz的频段信息很容易被人耳听到。频率遮蔽效应(FME)。高频信息和低频

Differoucius

966人浏览 · 2021-11-18 17:49:00

Differoucius · 2021-11-18 17:49:00 发布

音频压缩编码概述

什么是音频信号

通常，将人耳可以听到的信号，叫做音频信号(20Hz-20kHz)。

人的发声器官能产生的频段在80-3400Hz左右。
正常人说话的语音频段在300-3000Hz左右。

人耳听觉系统三特性

人耳对不同频率的灵敏度不同。在2-5KHz的频段信息很容易被人耳听到。
频率遮蔽效应(FME)。高频信息和低频信息同时出现时，很难听出低频信息。
时域遮蔽效应(TME)。强信号出现时刻附近的弱信号，很难被听出。

音频编码技术概览

一般，将音频信息分为语音信息和音乐信息两类。

语音的编码技术包括波形编码、参数编码、混合编码等。

音乐的编码技术包括心理声学模型、自适应变换编码、霍夫曼编码等。

波形编码

缩写	全称	释义
PCM	Pulse Code Modulation	脉冲编码调制
DPCM	Differential Pulse Code Modulation	差分脉冲编码调制
APCM	Adaptive Pulse Code Modulation	自适应脉冲编码调制
ADPCM	Adaptive Differential Pulse Code Modulation	自适应差分脉冲编码调制

PCM与DPCM的区别：

PCM对采样信号进行量化编码。
DPCM对实际信号值与预测信号值之差进行量化编码。

ADPCM核心思想：

对差值进行编码预测。
非均匀量化，大量化阶适应大差值，小量化阶适应小差值。

参数编码

缩写	全称	释义
LPC	Linear Predictive Coding	线性预测编码

混合编码

缩写	全称	释义
MP-LPC	Multi-Pulse-Linear Predictive Coding	多脉冲激励线性预测编码
RP-LPC	Regular Pulse Excited-Linear Predictive Coding	规划脉冲激励线性预测编码
CELP	Code Excited Linear Prediction	码本激励线性预测编码