低速接口系列——音频I2S

该协议已成为事实上的工业标准，因此许多半导体公司（如TI， ADI， Cirrus Logic）在其音频编解码器（Codec）或处理器的数据手册（Datasheet）和应用笔记（Application Note）中都会详细描述I2S接口及其与自家芯片的适配情况。在I2S之前，各家厂商有各自的接口，导致互操作性差，设计复杂。：使用示波器的延时（Delay）和Zoom功能，精确测量WS边沿与SD数据有

发烧李

1450人浏览 · 2025-09-19 11:24:29

发烧李 · 2025-09-19 11:24:29 发布

I2S在快消产品如手机、电脑、pad、座舱、音响等用途广泛，对I2S接口的全面总结。

1. 协议获取

I2S协议标准并非由IEEE或类似机构制定，而是由飞利浦半导体（现为恩智浦NXP）在1986年提出的一份技术标准。该标准文件名为《I2S Bus Specification》。

官方来源：最权威的获取方式是直接从恩智浦（NXP）的官方网站获取。通常可以在其官方支持页面上搜索到该文档的历史版本。
非官方来源：该协议已成为事实上的工业标准，因此许多半导体公司（如TI， ADI， Cirrus Logic）在其音频编解码器（Codec）或处理器的数据手册（Datasheet）和应用笔记（Application Note）中都会详细描述I2S接口及其与自家芯片的适配情况。这些文档是学习和应用I2S的极佳实践资源。

2. 技术演进历史

1986年：飞利浦半导体首次提出I2S标准，旨在解决其日益流行的数字音频芯片（如DAC， ADC， DSP）之间的互联标准化问题。在I2S之前，各家厂商有各自的接口，导致互操作性差，设计复杂。
目标：定义一个简单、低开销、专用于传输PCM（脉冲编码调制）音频数据的串行总线，分离数据和时钟信号，确保接收端能无误地重建原始数据。
至今：I2S标准本身非常成功且稳定，其核心框架自提出以来几乎没有变化。然而，围绕其产生了一些变体和扩展：
- TDM (Time-Division Multiplexing)：在相同的基本硬件线上，通过分时复用，传输多个音频通道（如8通道、16通道）。这是I2S最重要的扩展。
- 左/右对齐格式：一些厂商定义的与I2S类似但略有不同的格式，作为I2S的替代选项。
- PCM接口：在通信领域（如手机基带），常用的一种与I2S类似的接口，通常支持短帧同步脉冲。

尽管有这些扩展，“I2S” 这个术语通常特指标准的飞利浦格式，但它也常被用作一个统称，泛指所有基于类似原理的音频串行接口。

3. 技术原理

I2S是一种同步、串行、单向（注意：通常是单向，但全双工需两组总线）的数字音频通信协议。它由3根基本信号线组成：

SCK (Serial Clock) / BCLK (Bit Clock)：
- 时钟信号，由主设备（Master）产生。
- 频率 = 2 * 采样频率 * 量化位数。
- 例如：对于44.1kHz采样率、16位数据，SCK = 2 * 44100 * 16 = 1.4112 MHz。
- 对于24位或32位数据，即使有效数据只有24位，时钟通常也按32位计算（SCK = 2 * Fs * 32），高位补零，以实现对齐。
WS (Word Select) / LRCK (Left-Right Clock)：
- 字选择信号，由主设备产生。
- 用于指示当前传输的是左声道数据还是右声道数据。
- 低电平通常表示左声道。
- 高电平通常表示右声道。
- 频率等于采样频率（Fs）。
- 其边沿标志着数据帧的开始。
SD (Serial Data)：
- 串行数据信号，由发送设备驱动。
- 数据在SCK的驱动下，从最高位（MSB）到最低位（LSB）依次传输。
- 数据的有效性由WS信号定义。标准I2S协议中，数据在WS变化后的第二个SCK上升沿开始传输。

时序图（标准I2S格式）：

text

Left Channel Right Channel

...|---|-------|-------|-------|---|-------|-------|-------|---|...

___ ___ ___ ___ ___ ___ ___ ___

SCK \___/ \___/ \___/ \___/ \___/ \___/ \___/ \__

_______ _______

WS _______|_______________________|_______|_________________

| | | | | | | |

SD XX< MSB ><----- Left Channel Data ----->< MSB ><----- Right ...

注意：SD线上的数据在WS变化后和第一个SCK边沿时是不稳定的，从第二个SCK边沿开始才稳定并传输MSB。

4. 通信模式

主从模式 (Master-Slave)：
- 主设备 (Master)：产生SCK和WS时钟信号。通常是处理器、DSP或数字音频源。
- 从设备 (Slave)：接收主设备提供的SCK和WS时钟，并据此发送或接收数据。通常是ADC、DAC或音频编解码器。
- 一个系统中通常只有一个主设备，但可以有多个从设备（所有从设备共享SCK和WS，但每个数据流向需要独立的SD线）。
数据流向：
- 单向：最常见的配置。一条SD线用于播放（TX到DAC），另一条独立的SD线可用于录音（ADC到RX）。
- 全双工：需要两组独立的I2S总线（SCK， WS， SD_TX， SD_RX），或者使用时分复用（TDM）技术在一组总线上实现多通道双向通信。

5. 硬件电气特性

I2S本质上是板级（Board-Level）数字信号协议，通常不用于长距离机间连接（此时会使用AES3， S/PDIF等协议）。

电平标准：绝大多数现代CMOS芯片使用3.3V CMOS电平。但也存在一些老式设备或特定设备使用5V或1.8V电平。
关键特性：
- 信号类型：单端（Single-Ended）数字信号。
- 驱动能力：通常由CMOS输出缓冲器驱动，具有较强的驱动能力，但在高速或长走线时仍需考虑。
- 阻抗：没有严格的阻抗控制要求，但为了信号完整性，建议控制走线阻抗（通常50-60Ω）。
设计注意点（硬件层面）：
- 电平匹配：如果主从设备供电电压不同（如1.8V主设备连接3.3V从设备），必须使用电平转换器（Level Shifter）。
- 布线规则：
  - 等长：SCK、WS和对应的SD线应尽可能保持等长走线，以消除时钟和数据之间的偏斜（Skew）。
  - 间距：I2S线应彼此靠近布线，并远离噪声源（如开关电源、射频线路）。
  - 参考地平面：下方应有完整的地平面作为回流路径。
- 端接（Termination）：在大多数低频（<10MHz）短距离应用中不需要端接。但在高频、长走线或多负载（如TDM）情况下，可能在源端串联一个小电阻（22-100Ω）来抑制振铃（Ringing）。

6. 设计注意点（系统与软件层面）

时钟精度：主设备产生的MCLK（主时钟，如果有）和SCK必须非常精确和稳定。jitter（抖动）会直接导致DAC输出信号的失真。
数据对齐：务必确保软件配置（数据位宽、格式）与硬件连接（I2S/TDM/左对齐/右对齐）以及从设备的要求完全匹配。最常见的错误是左右声道颠倒或数据位错位。
DMA使用：由于音频数据流庞大且连续，强烈建议使用DMA（直接内存访问）来搬运数据，以极大减轻CPU负担，避免因中断延迟导致的数据欠载（Underrun）或溢出（Overrun），从而产生“噼啪”噪声。
电源管理：音频电路（特别是模拟部分）对电源噪声非常敏感。需使用LDO并为模拟和数字部分使用独立的磁珠或0Ω电阻进行隔离。

7. 测试仪器选择和方法

数字示波器：最常用和最重要的工具。
- 选择：带宽至少为待测SCK频率的3-5倍。4通道示波器最为理想（可同时观测SCK， WS， SD_TX， SD_RX）。
- 测试方法：
  - 信号质量：测量上升/下降时间、过冲（Overshoot）、下冲（Undershoot）、振铃（Ringing）。确保信号符合逻辑电平要求且干净。
  - 时序关系：使用示波器的延时（Delay）和Zoom功能，精确测量WS边沿与SD数据有效窗口之间的建立时间（Setup Time）和保持时间（Hold Time），确保满足从设备的时序要求。
  - 触发：使用WS边沿触发，可以稳定地观测一帧（左或右声道）的数据。
逻辑分析仪：
- 选择：带足够多通道和高速采样率的型号。
- 测试方法：
  - 协议解码：最大的优势是配备I2S协议解码器软件，可以直接解析出SD线上传输的十六进制或二进制音频数据值，并与预期值对比，极大简化了调试过程。
  - 长时间监控：可以捕获长时间的信号活动，用于排查间歇性错误。
音频分析仪（如APx555）：
- 用途：在系统级别测试最终的模拟音频输出质量。
- 测试方法：通过I2S输入测试信号（如1kHz正弦波）给DUT，然后测量其模拟输出的THD+N（总谐波失真加噪声）、信噪比（SNR）、串扰（Crosstalk）等指标。这是最终的音质验收。

8. 验收标准

验收标准分为数字链路层和模拟性能层。

数字链路层验收标准：
1. 连通性：所有信号线物理连接正确。
2. 信号完整性：SCK， WS， SD信号干净，无过大的过冲、振铃或噪声。电平幅度符合要求。
3. 时序合规：建立时间和保持时间满足从设备数据手册中的最差情况要求。
4. 协议正确：数据格式（I2S/TDM/左/右）、位宽、字节序（MSB first）配置正确，逻辑分析仪解码出的数据与发送数据一致。
5. 无数据错误：长时间运行音频环路测试（如48小时），通过软件或人工监听，无任何“噼啪”声或噪声，表明无DMA错误或数据丢失。
模拟性能层验收标准（适用于整个音频系统）：
1. 频率响应：在20Hz-20kHz范围内平坦（如±0.1dB）。
2. 总谐波失真加噪声 (THD+N)：极低（如<-100dB @ 1kHz）。
3. 信噪比 (SNR)：极高（如>110dB（A-weighted））。
4. 通道分离度 (Crosstalk)：极高（如<-100dB @ 1kHz）。
5. 无底噪：在无信号输入时，模拟输出端的噪声不可闻或低于特定指标。

总结

I2S是一个设计优雅、高效且经久不衰的数字音频接口标准。深入理解其时序关系、主从模式和各种数据格式是成功设计音频系统的关键。硬件设计上需关注信号完整性和电平匹配，软件设计上需依赖DMA并正确配置寄存器。调试时，示波器和逻辑分析仪是必不可少的左右手，而最终的音质验收则需要专业的音频分析仪。

9、对上面I2S接口做完总结就联想大一个问题，还有对TDM、PDM的区别，如何选择呢？

当有多个音频器件、要考虑音频架构、同时权衡成本、复杂度、音质权衡，以及如何和现有的I2S架构整合。

得先明确TDM和PDM的核心区别：TDM是数字多路复用，适合高质量多声道；PDM是脉冲密度调制，适合紧凑低成本麦克风。

TDM vs. PDM 全面对比

TDM和PDM是两种截然不同的数字音频多路复用技术，它们服务于不同的应用场景，各有优劣。

1. 核心概念与原理

特性	TDM (Time-Division Multiplexing)	PDM (Pulse-Density Modulation)
本质	数字多路复用技术	调制技术
工作原理	在一个数据线上，通过时间切片的方式，轮流传输多个通道的完整PCM样本。每个通道占用一个固定的时隙（Slot）。	使用1位（比特）数据流来表示音频信号。1的密度代表信号的幅度。高密度（更多1）代表高正电压，低密度（更多0）代表高负电压。
数据格式	多比特精度的PCM数据（通常是16, 24, 32位）。	1比特位深的单比特数据流。
直观比喻	像一条循环传送带，每个格子里放着一个通道的一件完整货物（样本）。	像一个高速开关的水龙头，开关的频率固定，但开关的占空比（开的时间比例）代表水流量（音频幅度）。

原理图简析：

TDM时序 (以4通道为例)：

text

WS/FS (Frame Sync) _|'''|_______________________|'''|___________________...

SCK/BCLK (Bit Clock) __|_|_|_|_|_|_|_|_|_|_|_|_|_|_|_|_|_|_|_|_|_|_|_|_|_...

SD (Serial Data) [Ch1 ][Ch2 ][Ch3 ][Ch4 ]...[Ch1 ][Ch2 ][Ch3 ][Ch4 ]...

- 一个WS帧同步脉冲内，包含多个时隙（Slot），每个时隙传输一个通道的完整样本（例如32个SCK周期传输24位数据，高位补零）。
PDM波形：

text

模拟信号: ~~~~~~~~~~~峰~~~~~~~~~~~~~~谷~~~~~~~~~~~~~

PDM 1-bit流: 1111101111111011110000000010000000010000...

- 在信号峰值附近，1的密度非常高；在信号谷值附近，0的密度非常高。

2. 技术对比详表

对比维度	TDM	PDM
数据分辨率	高。多比特（16/24/32位），动态范围大，理论精度高。	低。1比特。单比特流本身动态范围有限，但其噪声整形技术将量化噪声推向高频，从而在音频带内获得很高的动态范围（通常可达105dB以上）。
时钟频率	相对较低。SCK = 2 * Fs * 位数 * 通道数。例如8通道、48kHz、32位时，SCK ≈ 6.144 MHz。	极高。时钟频率（PDM_CLK）通常是采样率（Fs）的64倍或更高（例如： oversampling）。常见范围：1 MHz ~ 3.2 MHz。
所需线数	少（对于多通道优势明显）。无论多少通道，只需3根线（SCK, WS, SD）即可传输所有数据。	多。通常每个麦克风或一对麦克风需要独立的数据线。虽然时钟可以共享，但数据线是独立的。
系统复杂度	接收端（处理器/Codec）简单。直接接收到结构化的PCM数据，可存入内存直接处理。发送端（麦克风）复杂。麦克风内部需集成ADC、DSP（用于调制和噪声整形）和TDM控制器。	接收端（处理器）复杂。必须集成PDM接口和数字滤波器（Decimation Filter），将高速1比特流转换回多比特的低采样率PCM数据。这个过程计算量大，消耗资源。发送端（麦克风）简单。MEMS麦克风核心结构简单，直接输出PDM信号。
抗干扰性	中等。多比特数据，单个位错误对样本值影响较大。	较强。1比特信号，非0即1，抗干扰能力强。但高频时钟线易成为干扰源。
主要应用	高质量多通道音频传输。 * 专业音频接口、调音台 * 车载多麦克风降噪系统 * 多通道ADC/DAC编解码器	紧凑型、低成本麦克风阵列。 * 手机、电脑、智能音箱的麦克风 * 智能家居设备的语音唤醒 * 任何需要小型化模拟麦克风的场景
成本与集成	麦克风端成本高，系统布线成本低。适合通道数多、布局相对集中的系统。	麦克风端成本极低（MEMS麦克风工艺成熟），系统布线成本高（数据线随麦数增加而增加）。适合通道数少、麦克风需分散布置的系统。

3. 设计注意点

TDM设计注意点：

时序对齐：必须确保所有接收设备对时隙的定义一致（例如，哪个时隙是通道1）。配置错误会导致通道错位。
时钟精度：高通道数会带来很高的SCK频率，对PCB布线的时序要求严格（需要等长布线）。
电源噪声：由于传输的是高精度PCM数据，电源噪声会直接影响音频质量，需良好的电源滤波和隔离。

PDM设计注意点：

时钟质量：PDM_CLK的频率非常高，其抖动（Jitter）会直接引入到音频信号中，严重影响信噪比。必须使用干净、稳定的时钟源。
数字滤波器（Decimation Filter）：这是决定音质的关键。滤波器的性能决定了最终PCM数据的带宽、阻带抑制和带内平坦度。通常由处理器端的IP核实现。
布线对称性：对于差分PDM信号（如双麦克风共享时钟和数据线），布线时应保持差分对等长、紧密耦合，以抑制共模噪声。
功耗：持续运行在数MHz频率下的PDM接口和数字滤波器是其功耗的主要来源，在低功耗设备中需谨慎管理。

4. 总结与选择建议

	TDM	PDM
优势	通道密度高，布线精简，数据可直接使用，适合高质量、多通道应用。	传感器端极其简单、廉价、小巧，抗干扰能力强，适合麦克风阵列和消费电子。
劣势	麦克风需要集成更多功能，成本更高。	数据不可直接使用，需要复杂后端处理，布线多，时钟要求苛刻。
如何选择	当你需要传输4个以上通道的音频，且追求高音质和系统集成度时，选择TDM。例如专业录音设备、车载音响系统。	当你需要2-4个低成本、小体积的麦克风，并且主芯片带有PDM接口时，选择PDM。例如手机、TWS耳机、智能音箱。