Linux-音频应用编程

系统下一套标准的、先进的音频驱动框架，那么这套框架的设计本身是比较复杂的，采用分离、分层思想设计而成，具体的细节便不给大家介绍了！提供的接口确实非常多、模块很多，以上所列举出来的这些模块，很多模块笔者也不是很清楚它们的具体功能、作用，但是本章我们仅涉及到三个模块下的 API。提供的库函数也别多，笔者肯定不会全部给大家介绍，只介绍基础的使用方法，关于更加深入、更加详细的使用方法需要大家自己去研究、学

路溪非溪

1976人浏览 · 2024-12-07 11:06:13

路溪非溪 · 2024-12-07 11:06:13 发布

直接参考正点原子开发手册即可，本文仅作为个人学习记录使用。

ALPHA I.MX6U 开发板支持音频，板上搭载了音频编解码芯片 WM8960，支持播放以及录音功能！本章我们来学习 Linux 下的音频应用编程，音频应用编程相比于前面几个章节所介绍的内容、其难度有所上升，但是笔者仅向大家介绍 Linux 音频应用编程中的基础知识，而更多细节、更加深入的内容需要大家自己去学习。

本章将会讨论如下主题内容。

⚫ Linux 下 ALSA 框架概述；

⚫ alsa-lib 库介绍；

⚫ alsa-lib 库移植；

⚫ alsa-lib 库的使用；

⚫ 音频应用编程之播放；

⚫ 音频应用编程之录音。

ALSA 概述

ALSA 是 Advanced Linux Sound Architecture（高级的 Linux音频架构）的缩写，目前已经成为了 linux下的主流音频体系架构，提供了音频和 MIDI 的支持，替代了原先旧版本中的 OSS（开发声音系统）；学习过 Linux 音频驱动开发的读者肯定知道这个；事实上，ALSA 是 Linux 系统下一套标准的、先进的音频驱动框架，那么这套框架的设计本身是比较复杂的，采用分离、分层思想设计而成，具体的细节便不给大家介绍了！作为音频应用编程，我们不用去研究这个。

在应用层，ALSA 为我们提供了一套标准的 API，应用程序只需要调用这些 API 就可完成对底层音频硬件设备的控制，譬如播放、录音等，这一套 API 称为 alsa-lib。如下图所示：

alsa-lib 简介

如上所述，alsa-lib 是一套 Linux 应用层的 C 语言函数库，为音频应用程序开发提供了一套统一、标准的接口，应用程序只需调用这一套 API 即可完成对底层声卡设备的操控，譬如播放与录音。

用户空间的 alsa-lib 对应用程序提供了统一的 API 接口，这样可以隐藏驱动层的实现细节，简化了应用程序的实现难度、无需应用程序开发人员直接去读写音频设备节点。所以本章，对于我们来说，学习音频应用编程其实就是学习 alsa-lib 库函数的使用、如何基于 alsa-lib 库函数开发音频应用程序。

ALSA 提供了关于 alsa-lib 的使用说明文档，其链接地址为：https://www.alsa-project.org/alsa-doc/alsa-lib/，

进入到该链接地址后，如下所示：

alsa-lib 库支持功能比较多，提供了丰富的 API 接口供应用程序开发人员调用，根据函数的功能、作用将这些 API 进行了分类，可以点击上图中 Modules 按钮查看其模块划分，如下所示：

一个分类就是一个模块（module），有些模块下可能该包含了子模块，譬如上图中，模块名称前面有三角箭头的表示该模块包含有子模块。

⚫ Global defines and functions：包括一些全局的定义，譬如函数、宏等；

⚫ Constants for Digital Audio Interfaces：数字音频接口相关的常量；

⚫ Input Interface：输入接口；

⚫ Output Interface：输出接口；

⚫ Error handling：错误处理相关接口；

⚫ Configuration Interface：配置接口；

⚫ Control Interface：控制接口；

⚫ PCM Interface：PCM 设备接口；

⚫ RawMidi Interface：RawMidi 接口；

⚫ Timer Interface：定时器接口；

⚫ Hardware Dependant Interface：硬件相关接口；

⚫ MIDI Sequencer：MIDI 音序器；

⚫ External PCM plugin SDK：外部 PCM 插件 SDK；

⚫ External Control Plugin SDK：外部控制插件 SDK；

⚫ Mixer Interface：混音器接口；

⚫ Use Case Interface：用例接口；

⚫ Topology Interface：拓扑接口。

可以看到，alsa-lib 提供的接口确实非常多、模块很多，以上所列举出来的这些模块，很多模块笔者也不是很清楚它们的具体功能、作用，但是本章我们仅涉及到三个模块下的 API 函数，包括：PCM Interface、Error Interface 以及 Mixer Interface。

PCM Interface

PCM Interface，提供了 PCM 设备相关的操作接口，譬如打开/关闭 PCM 设备、配置 PCM 设备硬件或软件参数、控制 PCM 设备（启动、暂停、恢复、写入/读取数据），该模块下还包含了一些子模块，如下所示：

点击模块名称可以查看到该模块提供的API接口有哪些以及相应的函数说明，这里就不给大家演示了！

Error Interface

该模块提供了关于错误处理相关的接口，譬如函数调用发生错误时，可调用该模块下提供的函数打印错误描述信息。

Mixer Interface

提供了关于混音器相关的一系列操作接口，譬如音量、声道控制、增益等等。

sound设备节点

在 Linux 内核设备驱动层、基于 ALSA 音频驱动框架注册的 sound 设备会在/dev/snd 目录下生成相应的设备节点文件，譬如 ALPHA I.MX6U 开发板出厂系统/dev/snd 目录下有如下文件：

Tips：注意，Mini I.MX6U 开发板出厂系统/dev/snd 目录下是没有这些文件的，因为 Mini 板不支持音频、没有板载音频编解码芯片，所以本章实验例程无法在 Mini 板上进行测试，请悉知！

从上图可以看到有如下设备文件：

⚫ controlC0：用于声卡控制的设备节点，譬如通道选择、混音器、麦克风的控制等，C0 表示声卡 0（card0）；

⚫ pcmC0D0c：用于录音的 PCM 设备节点。其中 C0 表示 card0，也就是声卡 0；而 D0 表示 device0，也就是设备 0；最后一个字母 c 是 capture 的缩写，表示录音；所以 pcmC0D0c 便是系统的声卡0 中的录音设备 0；

⚫ pcmC0D0p：用于播放（或叫放音、回放）的 PCM 设备节点。其中 C0 表示 card0，也就是声卡 0；而 D0 表示 device 0，也就是设备 0；最后一个字母 p 是 playback 的缩写，表示播放；所以 pcmC0D0p便是系统的声卡 0 中的播放设备 0；

⚫ pcmC0D1c：用于录音的 PCM 设备节点。对应系统的声卡 0 中的录音设备 1；

⚫ pcmC0D1p：用于播放的 PCM 设备节点。对应系统的声卡 0 中的播放设备 1。

⚫ timer：定时器。

本章我们编写的应用程序，虽然是调用 alsa-lib 库函数去控制底层音频硬件，但最终也是落实到对 sound设备节点的 I/O 操作，只不过 alsa-lib 已经帮我们封装好了。在 Linux 系统的/proc/asound 目录下，有很多的文件，这些文件记录了系统中声卡相关的信息，如下所示：

cards：

通过"cat /proc/asound/cards"命令、查看 cards 文件的内容，可列出系统中可用的、注册的声卡，如下所示：

cat /proc/asound/cards

我们的阿尔法板子上只有一个声卡（WM8960 音频编解码器），所以它的编号为 0，也就是 card0。系统中注册的所有声卡都会在/proc/asound/目录下存在一个相应的目录，该目录的命名方式为 cardX（X 表示声卡的编号），譬如图 28.3.2 中的 card0；card0 目录下记录了声卡 0 相关的信息，譬如声卡的名字以及声卡注册的 PCM 设备，如下所示：

devices：

列出系统中所有声卡注册的设备，包括 control、pcm、timer、seq 等等。如下所示：

cat /proc/asound/devices

pcm：

列出系统中的所有 PCM 设备，包括 playback 和 capture：

cat /proc/asound/pcm

alsa-lib移植

因为 alsa-lib 是 ALSA 提供的一套 Linux 下的 C 语言函数库，需要将 alsa-lib 移植到开发板上，这样基于 alsa-lib 编写的应用程序才能成功运行，除了移植 alsa-lib 库之外，通常还需要移植 alsa-utils，alsa-utils 包含了一些用于测试、配置声卡的工具。

事实上，ALPHA I.MX6U 开发板出厂系统中已经移植了 alsa-lib 和 alsa-utils，本章我们直接使用出厂系统移植好的 alsa-lib 和 alsa-utils 进行测试，笔者也就不再介绍移植过程了。其实它们的移植方法也非常简单，如果你想自己尝试移植，网上有很多参考，大家可以自己去看看。

alsa-utils 提供了一些用于测试、配置声卡的工具，譬如 aplay、arecord、alsactl、alsaloop、alsamixer、amixer 等，在开发板出厂系统上可以直接使用这些工具，这些应用程序也都是基于 alsa-lib 编写的。

aplay

aplay 是一个用于测试音频播放功能程序，可以使用 aplay 播放 wav 格式的音频文件，如下所示：

程序运行之后就会开始播放音乐，因为 ALPHA 开发板支持喇叭和耳机自动切换，如果不插耳机默认从喇叭播放音乐，插上耳机以后喇叭就会停止播放，切换为耳机播放音乐，这个大家可以自己进行测试。

需要注意的是，aplay 工具只能解析 wav 格式音频文件，不支持 mp3 格式解码，所以无法使用 aplay 工具播放 mp3 音频文件。稍后笔者会向大家介绍如何基于 alsa-lib 编写一个简单地音乐播放器，实现与 aplay相同的效果。

更多命令参考正电原子应用开发手册即可。

暂略。

编写一个简单的alsa-lib应用程序

本小节开始，我们来学习如何基于 alsa-lib 编写音频应用程序，alsa-lib 提供的库函数也别多，笔者肯定不会全部给大家介绍，只介绍基础的使用方法，关于更加深入、更加详细的使用方法需要大家自己去研究、学习。

对于 alsa-lib 库的使用，ALSA 提供了一些参考资料来帮助应用程序开发人员快速上手 alsa-lib、基于alsa-lib 进行应用编程，以下笔者给出了链接：

https://users.suse.com/~mana/alsa090_howto.html

https://www.alsa-project.org/alsa-doc/alsa-lib/examples.html

第一份文档向用户介绍了如何使用 alsa-lib 编写简单的音频应用程序，包括 PCM 播放音频、PCM 录音等，笔者也是参考了这份文档来编写本章教程，对应初学者，建议大家看一看。

第二个链接地址是 ALSA 提供的一些示例代码，如下所示：

点击对应源文件即可查看源代码。

以上便是 ALSA 提供的帮助文档以及参考代码，链接地址已经给出了，大家有兴趣可以看一下。

本小节笔者将向大家介绍如何基于 alsa-lib 编写一个简单地音频应用程序，譬如播放音乐、录音等；但在此之前，首先我们需要先来了解一些基本的概念，为后面的学习打下一个坚实的基础！

一些基本概念

主要是与音频相关的基本概念，因为在 alsa-lib 应用编程中会涉及到这些概念，所以先给大家进行一个简单地介绍。

样本长度（Sample）

样本是记录音频数据最基本的单元，样本长度就是采样位数，也称为位深度（Bit Depth、Sample Size、Sample Width）。是指计算机在采集和播放声音文件时，所使用数字声音信号的二进制位数，或者说每个采样样本所包含的位数（计算机对每个通道采样量化时数字比特位数），通常有 8bit、16bit、24bit 等。

声道数（channel）

分为单声道(Mono)和双声道/立体声(Stereo)。1 表示单声道、2 表示立体声。

帧（frame）

帧记录了一个声音单元，其长度为样本长度与声道数的乘积，一段音频数据就是由苦干帧组成的。

把所有声道中的数据加在一起叫做一帧，对于单声道：一帧 = 样本长度 * 1；双声道：一帧 = 样本长度 * 2。譬如对于样本长度为 16bit 的双声道来说，一帧的大小等于：16 * 2 / 8 = 4 个字节。

采样率（Sample rate）

也叫采样频率，是指每秒钟采样次数，该次数是针对桢而言。譬如常见的采样率有：

8KHz：电话所用采样率

22.05KHz：FM 调频广播所用采样率

44.1KHz：音频 CD，也常用于 MPEG-1 音频（VCD、SVCD、MP3）所用采样率

48KHz：miniDV、数字电视、DVD、DAT、电影和专业音频所用的数字声音所用采样率。

交错模式（interleaved）

交错模式是一种音频数据的记录方式，分为交错模式和非交错模式。在交错模式下，数据以连续桢的形式存放，即首先记录完桢 1 的左声道样本和右声道样本（假设为立体声格式），再记录桢 2 的左声道样本和右声道样本。而在非交错模式下，首先记录的是一个周期内所有桢的左声道样本，再记录右声道样本，数据是以连续通道的方式存储。不过多数情况下，我们一般都是使用交错模式。

周期（period）

周期是音频设备处理（读、写）数据的单位，换句话说，也就是音频设备读写数据的单位是周期，每一次读或写一个周期的数据，一个周期包含若干个帧；譬如周期的大小为 1024 帧，则表示音频设备进行一次读或写操作的数据量大小为 1024 帧，假设一帧为 4 个字节，那么也就是 1024*4=4096 个字节数据。

一个周期其实就是两次硬件中断之间的帧数，音频设备每处理（读或写）完一个周期的数据就会产生一个中断，所以两个中断之间相差一个周期，关于中断的问题，稍后再向大家介绍！

缓冲区（buffer）

数据缓冲区，一个缓冲区包含若干个周期，所以 buffer 是由若干个周期所组成的一块空间。下面一张图直观地表示了 buffer、period、frame、sample（样本长度）之间的关系，假设一个 buffer 包含 4 个周期、而一个周包含 1024 帧、一帧包含两个样本（左、右两个声道）：

音频设备底层驱动程序使用 DMA 来搬运数据，这个 buffer 中有 4 个 period，每当 DMA 搬运完一个period 的数据就会触发一次中断，因此搬运整个 buffer 中的数据将产生 4 次中断。ALSA 为什么这样做？直接把整个 buffer 中的数据一次性搬运过去岂不是更快？情况并非如此，我们没有考虑到一个很重要的问题，那就是延迟；如果数据缓存区 buffer 很大，一次传输整个 buffer 中的数据可能会导致不可接受的延迟，因为一次搬运的数据量越大，所花费的时间就越长，那么必然会导致数据从传输开始到发出声音（以播放为例）这个过程所经历的时间就会越长，这就是延迟。为了解决这个问题，ALSA 把缓存区拆分成多个周期，以周期为传输单元进行传输数据。

所以，周期不宜设置过大，周期过大会导致延迟过高；但周期也不能太小，周期太小会导致频繁触发中断，这样会使得 CPU 被频繁中断而无法执行其它的任务，使得效率降低！所以，周期大小要合适，在延迟可接受的情况下，尽量设置大一些，不过这个需要根据实际应用场合而定，有些应用场合，可能要求低延迟、实时性高，但有些应用场合没有这种需求。

数据之间的传输

这里再介绍一下数据之间传输的问题，这个问题很重要，大家一定要理解，这样会更好的帮助我们理解代码、理解代码的逻辑。

⚫ PCM 播放情况下

在播放情况下，buffer 中存放了需要播放的 PCM 音频数据，由应用程序向 buffer 中写入音频数据，buffer中的音频数据由 DMA 传输给音频设备进行播放，所以应用程序向 buffer 写入数据、音频设备从 buffer 读取数据，这就是 buffer 中数据的传输情况。

图 28.5.2 中标识有 read pointer 和 write pointer 指针，write pointer 指向当前应用程序写 buffer 的位置、read pointer 指向当前音频设备读 buffer 的位置。在数据传输之前（播放之前），buffer 缓冲区是没有数据的，此时 write/read pointer 均指向了 buffer 的起始位置，也就是第一个周期的起始位置，如下所示：

应用程序向 buffer 写入多少帧数据，则 write pointer 指针向前移动多少帧，当应用程序向 buffer 中写入一个周期的数据时，write pointer 指针将向前移动一个周期；接着再写入一个周期，指针再向前移动一个周期，以此类推！当 write pointer 移动到 buffer 末尾时，又会回到 buffer 的起始位置，以此循环！所以由此可知，这是一个环形缓冲区。

以上是应用程序写 buffer 的一个过程，接着再来看看音频设备读 buffer（播放）的过程。在播放开始之前，read pointer 指向了 buffer 的起始位置，也就是第一个周期的起始位置。音频设备每次只播放一个周期的数据（读取一个周期），每一次都是从 read pointer 所指位置开始读取；每读取一个周期，read pointer 指针向前移动一个周期，同样，当 read pointer 指针移动到 buffer 末尾时，又会回到 buffer 的起始位置，以此构成一个循环！

应用程序需要向 buffer 中写入音频数据，音频设备才能读取数据进行播放，如果 read pointer 所指向的周期并没有填充音频数据，则无法播放！当 buffer 数据满时，应用程序将不能再写入数据，否则就会覆盖之前的数据，必须要等待音频设备播放完一个周期，音频设备每播放完一个周期，这个周期就变成空闲状态了，此时应用程序就可以写入一个周期的数据以填充这个空闲周期。

⚫ PCM 录音情况下

在录音情况下，buffer 中存放了音频设备采集到的音频数据（外界模拟声音通过 ADC 转为数字声音），由音频设备向 buffer 中写入音频数据（DMA 搬运），而应用程序从 buffer 中读取数据，所以音频设备向buffer 写入数据、应用程序从 buffer 读取数据，这就是录音情况下 buffer 中数据的传输情况。

回到图 28.5.2 中，此时 write pointer 指向音频设备写 buffer 的位置、read pointer 指向应用程序读 buffer的位置。在录音开始之前，buffer 缓冲区是没有数据的，此时 write/read pointer 均指向了 buffer 的起始位置，也就是第一个周期的起始位置，如图 28.5.3 中所示。

音频设备向 buffer 写入多少帧数据，则 write pointer 指针向前移动多少帧，音频设备每次只采集一个周期，将采集到的数据写入 buffer 中，从 write pointer 所指位置开始写入；当音频设备向 buffer 中写入一个周期的数据时，write pointer 指针将向前移动一个周期；接着再写入一个周期，指针再向前移动一个周期，以此类推！当 write pointer 移动到 buffer 末尾时，又会回到 buffer 的起始位置，以此构成循环！

以上是音频设备写 buffer 的一个过程，接着再来看看应用程序读 buffer 的过程。在录音开始之前，read pointer 指向了 buffer 的起始位置，也就是第一个周期的起始位置。同样，应用程序从 buffer 读取了多少帧数据，则 read pointer 指针向前移动多少帧；从 read pointer 所指位置开始读取，当 read pointer 指针移动到buffer 末尾时，又会回到 buffer 的起始位置，以此构成一个循环！

音频设备需要向 buffer 中写入音频数据，应用程序才能从 buffer 中读取数据（录音），如果 read pointer所指向的周期并没有填充音频数据，则无法读取！当 buffer 中没有数据时，需要等待音频设备向 buffer 中写入数据，音频设备每次写入一个周期，当应用程序读取完这个周期的数据后，这个周期又变成了空闲周期，需要等待音频设备写入数据。

Over and Under Run

当一个声卡处于工作状态时，环形缓冲区 buffer 中的数据总是连续地在音频设备和应用程序缓存区间传输，如下图所示：

上图展示了声卡在工作状态下，buffer 中数据的传输情况，总是连续地在音频设备和应用程序缓存区间传输，但事情并不总是那么完美、也会出现有例外；譬如在录音例子中，如果应用程序读取数据不够快，环形缓冲区 buffer 中的数据已经被音频设备写满了、而应用程序还未来得及读走，那么数据将会被覆盖；这种数据的丢失被称为 overrun。在播放例子中，如果应用程序写入数据到环形缓冲区 buffer 中的速度不够快，缓存区将会“饿死”（缓冲区中无数据可播放）；这样的错误被称为 underrun（欠载）。在 ALSA 文档中，将这两种情形统称为"XRUN"，适当地设计应用程序可以最小化 XRUN 并且可以从中恢复过来。

打开 PCM 设备

从本小节开始，将正式介绍如何编写一个音频应用程序，首先我们需要在应用程序中包含 alsa-lib 库的头文件<alsa/asoundlib.h>，这样才能在应用程序中调用 alsa-lib 库函数以及使用相关宏。

第一步需要打开 PCM 设备，调用函数 snd_pcm_open()，该函数原型如下所示：
int snd_pcm_open(snd_pcm_t **pcmp, 
                 const char *name, 
                 snd_pcm_stream_t stream, 
                 int mode)
该函数一共有 4 个参数，如下所示：

pcmp：snd_pcm_t 用于描述一个 PCM 设备，所以一个 snd_pcm_t 对象表示一个 PCM 设备；snd_pcm_open 函数会打开参数 name 所指定的设备，实例化 snd_pcm_t 对象，并将对象的指针（也就是 PCM 设备的句柄）通过 pcmp 返回出来。

name：参数 name 指定 PCM 设备的名字。alsa-lib 库函数中使用逻辑设备名而不是设备文件名，命名方式为"hw:i,j"，i 表示声卡的卡号，j 则表示这块声卡上的设备号；譬如"hw:0,0"表示声卡 0 上的PCM 设备 0，在播放情况下，这其实就对应/dev/snd/pcmC0D0p（如果是录音，则对应/dev/snd/pcmC0D0c）。除了使用"hw:i,j"这种方式命名之外，还有其它两种常用的命名方式，譬如"plughw:i,j"、"default"等，关于这些名字的不同，本章最后再向大家进行简单地介绍，这里暂时先不去理会这个问题。

stream：参数 stream 指定流类型，有两种不同类型：SND_PCM_STREAM_PLAYBACK 和 SND_PCM_STREAM_CAPTURE ； SND_PCM_STREAM_PLAYBACK 表示播放，SND_PCM_STREAM_CAPTURE 则表示采集。

mode：最后一个参数 mode 指定了 open 模式，通常情况下，我们会将其设置为 0，表示默认打开模式，默认情况下使用阻塞方式打开设备；当然，也可将其设置为 SND_PCM_NONBLOCK，表示以非阻塞方式打开设备。

设备打开成功，snd_pcm_open 函数返回 0；打开失败，返回一个小于 0 的错误编号，可以使用 alsa-lib提供的库函数 snd_strerror()来得到对应的错误描述信息，该函数与 C 库函数 strerror()用法相同。

与 snd_pcm_open 相对应的是 snd_pcm_close()，函数 snd_pcm_close()用于关闭 PCM 设备，函数原型如下所示：
int snd_pcm_close(snd_pcm_t *pcm);
使用示例：

调用 snd_pcm_open()函数打开声卡 0 的 PCM 播放设备 0：
snd_pcm_t *pcm_handle = NULL;
int ret;

ret = snd_pcm_open(&pcm_handle, "hw:0,0", SND_PCM_STREAM_PLAYBACK, 0);
if (0 > ret) {
    fprintf(stderr, "snd_pcm_open error: %s\n", snd_strerror(ret));
    return -1;
}
以上是打开和关闭PCM设备。

设置硬件参数

打开 PCM 设备之后，接着我们需要对设备进行设置，包括硬件配置和软件配置。软件配置就不再介绍了，使用默认配置即可！我们主要是对硬件参数进行配置，譬如采样率、声道数、格式、访问类型、period周期大小、buffer 大小等。

实例化 snd_pcm_hw_params_t 对象

alsa-lib 使用 snd_pcm_hw_params_t 数据类型来描述 PCM 设备的硬件配置参数，在配置参数之前，我们需要实例化一个 snd_pcm_hw_params_t 对象，使用snd_pcm_hw_params_malloc 或 snd_pcm_hw_params_alloca()来实例化一个 snd_pcm_hw_params_t 对象，如下所示：
snd_pcm_hw_params_t *hwparams = NULL;

snd_pcm_hw_params_malloc(&hwparams);
或
snd_pcm_hw_params_alloca(&hwparams);
它们之间的区别也就是 C 库函数 malloc 和 alloca 之间的区别。当然，你也可以直接使用 malloc()或 alloca() 来分配一个 snd_pcm_hw_params_t 对象，亦或者直接定义全局变量或栈自动变量。

与 snd_pcm_hw_params_malloc/snd_pcm_hw_params_alloca 相对应的是 snd_pcm_hw_params_free ， snd_pcm_hw_params_free()函数用于释放 snd_pcm_hw_params_t 对象占用的内存空间。函数原型如下所示：
void snd_pcm_hw_params_free(snd_pcm_hw_params_t *obj)
初始化 snd_pcm_hw_params_t 对象

snd_pcm_hw_params_t 对象实例化完成之后，接着我们需要对其进行初始化操作，调用 snd_pcm_hw_params_any()对 snd_pcm_hw_params_t 对象进行初始化操作，调用该函数会使用 PCM 设备当前的配置参数去初始化 snd_pcm_hw_params_t 对象，如下所示：
snd_pcm_hw_params_any(pcm_handle, hwparams);
第一个参数为 PCM 设备的句柄，第二个参数传入 snd_pcm_hw_params_t 对象的指针。

对硬件参数进行设置

alsa-lib 提供了一系列的 snd_pcm_hw_params_set_xxx 函数用于设置 PCM 设备的硬件参数，同样也提供

了一系列的 snd_pcm_hw_params_get_xxx 函数用于获取硬件参数。

(1)设置 access 访问类型：snd_pcm_hw_params_set_access()

调用 snd_pcm_hw_params_set_access 设置访问类型，其函数原型如下所示：
int snd_pcm_hw_params_set_access(snd_pcm_t *pcm,
                                 snd_pcm_hw_params_t * params,
                                 snd_pcm_access_t access 
)
参数 access 指定设备的访问类型，是一个 snd_pcm_access_t 类型常量，这是一个枚举类型，如下所示：
enum snd_pcm_access_t {
    SND_PCM_ACCESS_MMAP_INTERLEAVED = 0, //mmap access with simple interleaved channels
    SND_PCM_ACCESS_MMAP_NONINTERLEAVED, //mmap access with simple non interleaved channels
    SND_PCM_ACCESS_MMAP_COMPLEX, //mmap access with complex placement
    SND_PCM_ACCESS_RW_INTERLEAVED, //snd_pcm_readi/snd_pcm_writei access
    SND_PCM_ACCESS_RW_NONINTERLEAVED, //snd_pcm_readn/snd_pcm_writen access
    SND_PCM_ACCESS_LAST = SND_PCM_ACCESS_RW_NONINTERLEAVED
};
通常，将访问类型设置为 SND_PCM_ACCESS_RW_INTERLEAVED ，交错访问模式，通过 snd_pcm_readi/snd_pcm_writei 对 PCM 设备进行读/写操作。

函数调用成功返回 0；失败将返回一个小于 0 的错误码，可通过 snd_strerror()函数获取错误描述信息。

使用示例：
ret = snd_pcm_hw_params_set_access(pcm_handle, hwparams, SND_PCM_ACCESS_RW_INTERLEAVED);

if (0 > ret)
    fprintf(stderr, "snd_pcm_hw_params_set_access error: %s\n", snd_strerror(ret));
(2)设置数据格式：snd_pcm_hw_params_set_format()

调用 snd_pcm_hw_params_set_format()函数设置 PCM 设备的数据格式，函数原型如下所示：
nt snd_pcm_hw_params_set_format(snd_pcm_t *pcm,
                                snd_pcm_hw_params_t *params,
                                snd_pcm_format_t format
)
参数 format 指定数据格式，该参数是一个 snd_pcm_format_t 类型常量，这是一个枚举类型，如下所示：
num snd_pcm_format_t {
 SND_PCM_FORMAT_UNKNOWN = -1, 
 SND_PCM_FORMAT_S8 = 0,
 SND_PCM_FORMAT_U8,
 SND_PCM_FORMAT_S16_LE,
 SND_PCM_FORMAT_S16_BE,
 SND_PCM_FORMAT_U16_LE,
 SND_PCM_FORMAT_U16_BE,
 SND_PCM_FORMAT_S24_LE,
 SND_PCM_FORMAT_S24_BE,
 SND_PCM_FORMAT_U24_LE,
 SND_PCM_FORMAT_U24_BE,
 SND_PCM_FORMAT_S32_LE,
 SND_PCM_FORMAT_S32_BE,
 SND_PCM_FORMAT_U32_LE,
 SND_PCM_FORMAT_U32_BE,
 SND_PCM_FORMAT_FLOAT_LE,
 SND_PCM_FORMAT_FLOAT_BE,
 SND_PCM_FORMAT_FLOAT64_LE,
 SND_PCM_FORMAT_FLOAT64_BE,
 SND_PCM_FORMAT_IEC958_SUBFRAME_LE,
 SND_PCM_FORMAT_IEC958_SUBFRAME_BE,
 SND_PCM_FORMAT_MU_LAW,
 SND_PCM_FORMAT_A_LAW,
 SND_PCM_FORMAT_IMA_ADPCM,
 SND_PCM_FORMAT_MPEG,
 SND_PCM_FORMAT_GSM,
 SND_PCM_FORMAT_S20_LE,
 SND_PCM_FORMAT_S20_BE,
 SND_PCM_FORMAT_U20_LE,
 SND_PCM_FORMAT_U20_BE,
 SND_PCM_FORMAT_SPECIAL = 31,
 SND_PCM_FORMAT_S24_3LE = 32,
 SND_PCM_FORMAT_S24_3BE,
 SND_PCM_FORMAT_U24_3LE,
 SND_PCM_FORMAT_U24_3BE,
 SND_PCM_FORMAT_S20_3LE,
 SND_PCM_FORMAT_S20_3BE,
 SND_PCM_FORMAT_U20_3LE,
 SND_PCM_FORMAT_U20_3BE,
 SND_PCM_FORMAT_S18_3LE,
 SND_PCM_FORMAT_S18_3BE,
 SND_PCM_FORMAT_U18_3LE,
 SND_PCM_FORMAT_U18_3BE,
 SND_PCM_FORMAT_G723_24,
 SND_PCM_FORMAT_G723_24_1B,
 SND_PCM_FORMAT_G723_40,
 SND_PCM_FORMAT_G723_40_1B,
 SND_PCM_FORMAT_DSD_U8,
 SND_PCM_FORMAT_DSD_U16_LE,
 SND_PCM_FORMAT_DSD_U32_LE,
 SND_PCM_FORMAT_DSD_U16_BE,
 SND_PCM_FORMAT_DSD_U32_BE,
 SND_PCM_FORMAT_LAST = SND_PCM_FORMAT_DSD_U32_BE,
 SND_PCM_FORMAT_S16 = SND_PCM_FORMAT_S16_LE,
 SND_PCM_FORMAT_U16 = SND_PCM_FORMAT_U16_LE,
 SND_PCM_FORMAT_S24 = SND_PCM_FORMAT_S24_LE,
 SND_PCM_FORMAT_U24 = SND_PCM_FORMAT_U24_LE,
 SND_PCM_FORMAT_S32 = SND_PCM_FORMAT_S32_LE,
 SND_PCM_FORMAT_U32 = SND_PCM_FORMAT_U32_LE,
 SND_PCM_FORMAT_FLOAT = SND_PCM_FORMAT_FLOAT_LE,
 SND_PCM_FORMAT_FLOAT64 = SND_PCM_FORMAT_FLOAT64_LE,
 SND_PCM_FORMAT_IEC958_SUBFRAME = SND_PCM_FORMAT_IEC958_SUBFRAME_LE,
 SND_PCM_FORMAT_S20 = SND_PCM_FORMAT_S20_LE,
 SND_PCM_FORMAT_U20 = SND_PCM_FORMAT_U20_LE
};
的最多的格式是 SND_PCM_FORMAT_S16_LE，有符号 16 位、小端模式。当然，音频设备不一定支持用户所指定的格式，在此之前，用户可以调用 snd_pcm_hw_params_test_format()函数测试 PCM 设备是否支持某种格式，如下所示：
if (snd_pcm_hw_params_test_format(pcm_handle, hwparams, SND_PCM_FORMAT_S16_LE)) {
    // 返回一个非零值 表示不支持该格式
}
else {
    // 返回 0 表示支持
}
3)设置声道数：snd_pcm_hw_params_set_channels()

调用 snd_pcm_hw_params_set_channels()函数设置 PCM 设备的声道数，函数原型如下所示：
int snd_pcm_hw_params_set_channels(snd_pcm_t *pcm,
                                   snd_pcm_hw_params_t *params,
                                   unsigned int val
)
参数 val 指定声道数量，val=2 表示双声道，也就是立体声。函数调用成功返回 0，失败返回小于 0 的错误码。

使用示例：
ret = snd_pcm_hw_params_set_channels(pcm_handle, hwparams, 2);

if (0 > ret)
    fprintf(stderr, "snd_pcm_hw_params_set_channels error: %s\n", snd_strerror(ret));
(4)设置采样率大小：snd_pcm_hw_params_set_rate()

调用 snd_pcm_hw_params_set_rate 设置采样率大小，其函数原型如下所示：
nt snd_pcm_hw_params_set_rate(snd_pcm_t *pcm,
                              snd_pcm_hw_params_t *params,
                              unsigned int val,
                              int dir 
)
参数 val 指定采样率大小，譬如 44100；参数 dir 用于控制方向，若 dir=-1，则实际采样率小于参数 val指定的值；dir=0 表示实际采样率等于参数 val；dir=1 表示实际采样率大于参数 val。

函数调用成功返回 0；失败将返回小于 0 的错误码。

使用示例：
ret = snd_pcm_hw_params_set_rate(pcm_handle, hwparams, 44100, 0);

if (0 > ret)
    fprintf(stderr, "snd_pcm_hw_params_set_rate error: %s\n", snd_strerror(ret));
(5)设置周期大小：snd_pcm_hw_params_set_period_size()

这里说的周期，也就是 28.5.1 小节中向大家介绍的周期，一个周期的大小使用帧来衡量，譬如一个周期1024 帧；调用 snd_pcm_hw_params_set_period_size()函数设置周期大小，其函数原型如下所示：
int snd_pcm_hw_params_set_period_size(snd_pcm_t *pcm,
                                      snd_pcm_hw_params_t *params,
                                      snd_pcm_uframes_t val,
                                      int dir
)
alsa-lib 使用 snd_pcm_uframes_t 类型表示帧的数量；参数 dir 与 snd_pcm_hw_params_set_rate()函数的dir 参数意义相同。

使用示例（将周期大小设置为 1024 帧）：
ret = snd_pcm_hw_params_set_period_size(pcm_handle, hwparams, 1024, 0);

f (0 > ret)
    fprintf(stderr, "snd_pcm_hw_params_set_period_size error: %s\n", snd_strerror(ret));
注意，参数 val 的单位是帧、而不是字节。

(6)设置 buffer 大小：snd_pcm_hw_params_set_buffer_size()

调用 snd_pcm_hw_params_set_buffer_size()函数设置 buffer 的大小，其函数原型如下所示：
int snd_pcm_hw_params_set_buffer_size(snd_pcm_t *pcm,
                                     snd_pcm_hw_params_t *params,
                                     snd_pcm_uframes_t val
)
参数 val 指定 buffer 的大小，以帧为单位，通常 buffer 的大小是周期大小的整数倍，譬如 16 个周期；但函数 snd_pcm_hw_params_set_buffer_size()是以帧为单位来表示 buffer 的大小，所以需要转换一下，譬如将 buffer 大小设置为 16 个周期，则参数 val 等于 16 * 1024（假设一个周期为 1024 帧）=16384 帧。

函数调用成功返回 0；失败返回一个小于 0 的错误码。

使用示例：
ret = snd_pcm_hw_params_set_buffer_size(pcm_handle, hwparams, 16*1024);

if (0 > ret)
    fprintf(stderr, "snd_pcm_hw_params_set_buffer_size error: %s\n", snd_strerror(ret));
除了 snd_pcm_hw_params_set_buffer_size()函数之外，我们还可以调用 snd_pcm_hw_params_set_periods()函数设置 buffer 大小，其函数原型如下所示：
nt snd_pcm_hw_params_set_periods(snd_pcm_t *pcm,
                                 snd_pcm_hw_params_t *params,
                                 unsigned int val,
                                 int dir
)
参数 val 指定了 buffer 的大小，该大小以周期为单位、并不是以帧为单位，注意区分！

参数 dir 与 snd_pcm_hw_params_set_rate()函数的 dir 参数意义相同。

函数调用成功返回 0；失败将返回一个小于 0 的错误码。

使用示例：
ret = snd_pcm_hw_params_set_periods(pcm_handle, hwparams, 16, 0); //buffer 大小为 16 个周期

if (0 > ret)
    fprintf(stderr, "snd_pcm_hw_params_set_periods error: %s\n", snd_strerror(ret));
(7)安装/加载硬件配置参数：snd_pcm_hw_params()

参数设置完成之后，最后调用 snd_pcm_hw_params()加载/安装配置、将配置参数写入硬件使其生效，其函数原型如下所示：
int snd_pcm_hw_params(snd_pcm_t *pcm, snd_pcm_hw_params_t *params)
函数调用成功返回 0，失败将返回一个小于 0 的错误码。函数 snd_pcm_hw_params()调用之后，其内部会自动调用 snd_pcm_prepare()函数，PCM 设备的状态被更改为 SND_PCM_STATE_PREPARED。

设备有多种不同的状态，SND_PCM_STATE_PREPARED 为其中一种，关于状态的问题，后面在向大家介绍。调用 snd_pcm_prepare()函数会使得 PCM 设备处于 SND_PCM_STATE_PREPARED 状态（也就是处于一种准备好的状态）。

使用示例：
ret = snd_pcm_hw_params(pcm_handle, hwparams);

if (0 > ret)
    printf(stderr, "snd_pcm_hw_params error: %s\n", snd_strerror(ret));
更多待补充。

读/写数据

接下来就可以进行读/写数据了，如果是 PCM 播放，则调用 snd_pcm_writei()函数向播放缓冲区 buffer中写入音频数据；如果是 PCM 录音，则调用 snd_pcm_readi()函数从录音缓冲区 buffer 中读取数据，它们的函数原型如下所示：
snd_pcm_sframes_t snd_pcm_writei(snd_pcm_t *pcm,
                                 const void *buffer,
                                 snd_pcm_uframes_t size
)

snd_pcm_sframes_t snd_pcm_readi(snd_pcm_t *pcm,
                                void *buffer,
                                snd_pcm_uframes_t size
)
参数 pcm 为 PCM 设备的句柄；调用 snd_pcm_writei()函数，将参数 buffer（应用程序的缓冲区）缓冲区中的数据写入到驱动层的播放环形缓冲区 buffer 中，参数 size 指定写入数据的大小，以帧为单位；通常情况下，每次调用 snd_pcm_writei()写入一个周期数据。调用 snd_pcm_readi()函数，将从驱动层的录音环形缓冲区 buffer 中读取数据到参数 buffer 指定的缓冲区中（应用程序的缓冲区），参数size指定读取数据的大小，以帧为单位；通常情况下，每次调用snd_pcm_readi()读取一个周期数据。

Tips：snd_pcm_writei/snd_pcm_readi 函数原型中，参数 buffer 指的是应用程序的缓冲区，不要与驱动层的环形缓冲区搞混了！

snd_pcm_readi/snd_pcm_writei 调用成功，返回实际读取/写入的帧数；调用失败将返回一个负数错误码。即使调用成功，实际读取/写入的帧数不一定等于参数 size 所指定的帧数，仅当发生信号或 XRUN 时，返回的帧数可能会小于参数 size。

阻塞与非阻塞

调用 snd_pcm_open()打开设备时，若指定为阻塞方式，则调用 snd_pcm_readi/snd_pcm_writei 以阻塞方式进行读/写。对于 PCM 录音来说，当 buffer 缓冲区中无数据可读时，调用 snd_pcm_readi()函数将会阻塞，直到音频设备向 buffer 中写入采集到的音频数据；同理，对于 PCM 播放来说，当 buffer 缓冲区中的数据满时，调用 snd_pcm_writei()函数将会阻塞，直到音频设备从 buffer 中读走数据进行播放。若调用 snd_pcm_open()打开设备时，指定为非阻塞方式，则调用 snd_pcm_readi/snd_pcm_writei 以非阻塞方式进行读/写。对于 PCM 录音来说，当 buffer 缓冲区中无数据可读时，调用 snd_pcm_readi()不会阻塞、而是立即以错误形式返回；同理，对于 PCM 播放来说，当 buffer 缓冲区中的数据满时，调用 snd_pcm_writei()函数也不会阻塞、而是立即以错误形式返回。

snd_pcm_readn 和 snd_pcm_writen

snd_pcm_readi/snd_pcm_writei 适用于交错模式（interleaved）读/写数据，如果用户设置的访问类型并不是交错模式，而是非交错模式（non interleaved），此时便不可再使用 snd_pcm_readi/snd_pcm_writei 进行读写操作了，而需要使用 snd_pcm_readn 和 snd_pcm_writen 进行读写。

示例代码

示例代码之 PCM 播放

直接参考正点原子开发手册。

示例代码之 PCM 录音

直接参考正点原子开发手册。

使用异步方式

上小节中的示例代码 28.5.1 和示例代码 28.5.2 都是采用了同步方式进行读写，这样会使得应用程序无法做一些其它的事情，本小节我们来学习如何使用异步方式读写。

其实使用异步方式读写非常简单，只需要注册异步处理函数即可。

snd_async_add_pcm_handler()函数

alsa-lib 提供了 snd_async_add_pcm_handler()函数用于注册异步处理函数，其实我们只需要通过这个函数注册一个异步处理函数即可，其函数原型如下所示：
int snd_async_add_pcm_handler(snd_async_handler_t **handler,
                              snd_pcm_t *pcm,
                              snd_async_callback_t callback,
                              void *private_data
)
调用该函数需要传入 4 个参数：

handler：参数 snd_async_handler_t 用于描述一个异步处理，所以一个 snd_async_handler_t 对象表示一个异步处理对象；调用snd_async_add_pcm_handler()函数会实例化一个snd_async_handler_t对象，并将对象的指针（指针作为异步处理对象的句柄）通过*handler 返回出来。

⚫ pcm：pcm 设备的句柄。

⚫ callback：异步处理函数（或者叫回调函数），snd_async_callback_t 函数指针如下所示：
typedef void(*snd_async_callback_t)(snd_async_handler_t *handler)
参数 handler 也就是异步处理对象的句柄。

⚫ private_data：传递给异步处理函数的私有数据，私有数据的数据类型，可以由用户自己定义，调用 snd_async_add_pcm_handler()函数时，参数 private_date 指向你的私有数据对象。在异步处理函数中便可以获取到私有数据，调用 snd_async_handler_get_callback_private()函数即可，如下所示：
struct my_private_data *data = snd_async_handler_get_callback_private(handler);
关于 snd_async_add_pcm_handler()函数的参数介绍，就给大家说这么多。当调用该函数之后，用户传入的 PCM 设备将会与异步处理对象关联起来，在异步处理函数 callback 中可以通过异步处理对象的句柄获取到 PCM 设备的句柄，通过 snd_async_handler_get_pcm()获取，如下所示：
snd_pcm_t *pcm_handle = snd_async_handler_get_pcm(handler);
实现异步 I/O，应用程序通常需要完成这三件事情：

⚫ 使能异步 I/O；

⚫ 设置异步 I/O 的所有者；

⚫ 注册信号处理函数（譬如 SIGIO 信号或其它实时信号）。

这是内容在 13.3 小节给大家详细介绍过，这里不再啰嗦！所以由此可知，snd_async_add_pcm_handler函数中已经帮我们完成这些事情。

使用示例：
tatic void snd_playback_async_callback(snd_async_handler_t *handler)
{
    snd_pcm_t *handle = snd_async_handler_get_pcm(handler);//获取 PCM 句柄
    ......
}

int main(void)
{
    ......
    snd_async_handler_t *async_handler = NULL;
    /* 注册异步处理函数 */
    ret = snd_async_add_pcm_handler(&async_handler, pcm, snd_playback_async_callback, NULL);
    if (0 > ret)
        fprintf(stderr, "snd_async_add_pcm_handler error: %s\n", snd_strerror(ret));
    ......
}
调用 snd_async_add_pcm_handler()注册了异步回调函数 snd_playback_async_callback()，当环形缓冲区有空闲的周期可填充数据时（以播放为例），音频设备驱动程序会向应用程序发送信号（SIGIO），接着应用程序便会跳转到 snd_playback_async_callback()函数执行。

而对于录音来说，当环形缓冲区中有数据可读时（譬如音频设备已经录制了一个周期、并将数据写入到了环形缓冲区），驱动程序便会向应用程序发送信号，接着应用程序跳转到回调函数执行。

在播放情况下，通常我们会先将环形缓冲区填满，当音频设备每播放完一个周期，就会产生一个空闲周期，此时应用程序会接收到信号，进而跳转到异步回调函数中执行。

snd_pcm_avail_update()函数

在异步处理函数中，我们通常会使用到这个函数，在录音情况下，应用程序调用 snd_pcm_avail_update()函数用于获取当前可读取的帧数；在播放情况下，应用程序调用该函数用于获取当前可写入的帧数。换句话说，也就是驱动层环形缓冲区中当前有多少帧数据可读取（录音）或可写入多少帧数据（播放，环形缓冲区未满时、应用程序才可写入数据）。

该函数原型如下所示：
snd_pcm_sframes_t snd_pcm_avail_update(snd_pcm_t *pcm);
本小节主要给大家介绍这两个函数，因为后面的示例代码中会使用到。

PCM 播放示例-异步方式

通过上面的介绍，本小节我们来编写一个使用异步方式的PCM播放示例程序，直接基于示例代码 28.5.1进行修改，代码笔者已经写好了，如下所示：

本例程源码对应的路径为：开发板光盘 ->11 、 Linux C 应用编程例程源码 ->28_alsalib->pcm_playback_async.c。
直接参考正点原子开发手册
在 snd_pcm_init() 函数中，我们调用了 snd_async_add_pcm_handler() 函数注册了异步回调函数 snd_playback_async_callback()，当可写入数据时，跳转到 snd_playback_async_callback()函数去执行。

在异步回调函数中，我们首先调用 snd_pcm_avail_update()获取当前可写入多少帧数据，然后在 while()循环中调用 read()读取音频文件的数据、接着调用 snd_pcm_writei()向环形缓冲区写入数据，每次循环写入一个周期，直到把缓冲区写满，然后退出回调函数。

回到 main()函数中，在进入 for()死循环之前，我们先将环形缓冲区填满，执行的代码与回调函数中的代码相同，这里就不再说明了！

编译示例代码

在 Ubuntu 系统下执行命令，编译示例代码：

${CC} -o testApp testApp.c -lasound

试应用程序

将上面编译得到的可执行文件拷贝开发板 Linux 系统/home/root 目录下，然后在开发板上测试，大家自己去测！

PCM 录音示例-异步方式

本小节编写使用异步方式的 PCM 录音的示例程序，代码笔者已经写好了，如下所示：

本例程源码对应的路径为：开发板光盘 ->11 、 Linux C 应用编程例程源码 ->28_alsalib->pcm_capture_async.c。

份代码基于示例代码 28.5.2 改写，使用异步方式读取录制的音频数据。
直接参考正点原子开发手册
代码不再解释了，值得注意的是，在 main()函数中我们调用了 snd_pcm_start()函数，这个函数前面没给大家介绍过，该函数的作用其实如它命名那般，用于启动 PCM 设备，譬如在录音情况下，调用该函数开始录音；在播放情况下，调用该函数开始播放。

前面的几个示例代码中，为啥没有调用该函数呢？这个问题我们先留着、稍后再给大家介绍！

编译示例代码

执行命令编译示例代码：

${CC} -o testApp testApp.c -lasound

测试应用程序

将编译得到的可执行文件拷贝到开发板 Linux 系统/home/root 目录下，然后进行测试，测试方法与示例代码 28.5.2 对应的测试程序相同，这里不再重述，大家自己去测！

使用 poll()函数

上小节我们使用了异步 I/O 方式读写 PCM 设备，本小节我们来学习如何使用 poll I/O 多路复用来实现读写数据。

使用 poll I/O 多路复用实现读写

I/O 多路复用是一种高级 I/O，在第一篇 13.2 小节给大家进行了详细地介绍，可通过 select()或 poll()函数来实现 I/O 多路复用，本小节我们使用 poll()函数来实现 I/O 多路复用，接下来将向大家介绍！

获取计数：snd_pcm_poll_descriptors_count

该函数用于获取 PCM 句柄的轮询描述符计数，其函数原型如下所示：
int snd_pcm_poll_descriptors_count(snd_pcm_t *pcm);
调用该函数返回 PCM 句柄的轮询描述符计数。

分配 struct pollfd 对象

为每一个轮询描述符分配一个 struct pollfd 对象，譬如：
struct pollfd *pfds = NULL;
int count;

/* 获取 PCM 句柄的轮询描述符计数 */
count = snd_pcm_poll_descriptors_count(pcm);

if (0 >= count) {
    fprintf(stderr, "Invalid poll descriptors count\n");
    return -1;
}

/* 分配内存 */
pfds = calloc(count, sizeof(struct pollfd));
if (NULL == pfds) {
    perror("calloc error");
    return -1;
}
填充 struct pollfd：snd_pcm_poll_descriptors

接下来调用 snd_pcm_poll_descriptors()函数对 struct pollfd 对象进行填充（初始化），其函数原型如下所示：
int snd_pcm_poll_descriptors(
    snd_pcm_t *pcm,
    struct pollfd *pfds,
    unsigned int space
);
参数 space 表示 pfds 数组中的元素个数。
/* 填充 pfds */
ret = snd_pcm_poll_descriptors(pcm, pfds, count);
if (0 > ret)
    eturn -1;
poll+snd_pcm_poll_descriptors_revents

一切准备完成之后，就可以调用 poll()函数来监视 PCM 设备是否有数据可读或可写，当有数据可读或可写时，poll()函数返回，此时我们可以调用 snd_pcm_poll_descriptors_revents()函数获取文件描述符中返回的事件类型，并与 poll 的 events 标志进行比较，以确定是否可读或可写，snd_pcm_poll_descriptors_revents()

函数原型如下所示：
nt snd_pcm_poll_descriptors_revents(
    snd_pcm_t *pcm,
    struct pollfd *pfds,
    unsigned int nfds,
    unsigned short *revents
)
参数 nfds 表示 pfds 数组中元素的个数，调用该函数获取文件描述符中返回的事件，通过参数 revents 返回出来；注意，不要直接读取 struct pollfd 对象中的 revents 成员变量，因为 snd_pcm_poll_descriptors_revents()函数会对 poll()系统调用返回的 revents 掩码进行“分解”以纠正语义（POLLIN = 读取，POLLOUT = 写入）。

使用示例：
for ( ; ; ) {
    ret = poll(pfds, count, -1);//调用 poll
    if (0 > ret) {
        perror("poll error");
        return -1;
    }

    ret = snd_pcm_poll_descriptors_revents(pcm, pfds, count, &revents);
    if (0 > ret)
        return -1;
    
    if (revents & POLLERR) //发生 I/O 错误
        return -1;
    
    if (revents & POLLIN) {//表示可读取数据
        // 从 PCM 设备读取数据
    }
    
    if (revents & POLLOUT) {//表示可写入数据
        // 将数据写入 PCM 设备
    }
}
PCM 播放示例代码

对示例代码 28.5.1 进行修改，使用 poll I/O 多路复用，示例代码如下所示：

本例程源码对应的路径为：开发板光盘 ->11 、 Linux C 应用编程例程源码 ->28_alsalib->pcm_playback_poll.c。
直接参考正点原子开发手册
PCM 录音示例代码

对示例代码 28.5.2 进行修改，使用 poll I/O 多路复用，示例代码如下所示：

本例程源码对应的路径为：开发板光盘 ->11 、 Linux C 应用编程例程源码 ->28_alsalib->pcm_capture_poll.c。
直接参考正点原子开发手册

PCM 设备的状态

本小节向大家介绍 PCM 设备的状态有哪些，alsa-lib 提供了函数 snd_pcm_state()用于获取 PCM 设备当前的状态，其函数原型如下所示：
snd_pcm_state_t snd_pcm_state(snd_pcm_t *pcm);
可以看到它的返回值是一个 snd_pcm_state_t 类型的变量，snd_pcm_state_t 其实是一个枚举类型，描述了 PCM 设备包含的所有状态，如下所示：
enum snd_pcm_state_t {
    SND_PCM_STATE_OPEN = 0,
    SND_PCM_STATE_SETUP,
    SND_PCM_STATE_PREPARED,
    SND_PCM_STATE_RUNNING,
    SND_PCM_STATE_XRUN,
    SND_PCM_STATE_DRAINING,
    SND_PCM_STATE_PAUSED,
    SND_PCM_STATE_SUSPENDED,
    SND_PCM_STATE_DISCONNECTED,
    SND_PCM_STATE_LAST = SND_PCM_STATE_DISCONNECTED,
    SND_PCM_STATE_PRIVATE1 = 1024
}
SND_PCM_STATE_OPEN

该状态表示 PCM 设备处于打开状态，譬如当调用 snd_pcm_open()后，PCM 设备就处于该状态。

SND_PCM_STATE_SETUP

alsa-lib 文档中的解释为“Setup installed”！该状态表示设备已经初始化完成了，参数已经配置好了。

SND_PCM_STATE_PREPARED

该状态表示设备已经准备好了，可以开始了“Ready to start”！譬如可以开始播放了、可以开始录音了。

面提到了这个状态，当应用程序调用 snd_pcm_hw_params() 函数之后，设备就处于 SND_PCM_STATE_PREPARED 状态了。应用程序中，可以调用 snd_pcm_prepare()函数使设备处于

SND_PCM_STATE_PREPARED 状态，该函数原型如下所示：
int snd_pcm_prepare(snd_pcm_t *pcm);
该行数调用成功返回 0，失败将返回一个负数错误码。

函数调用成功，PCM 设备将处于 SND_PCM_STATE_PREPARED 状态。事实上，应用程序调用时 snd_pcm_hw_params()时，函数内部会自动调用 snd_pcm_prepare()，所以为什么调用 snd_pcm_hw_params() 之后设备就已经处于 SND_PCM_STATE_PREPARED 状态了；调用 snd_pcm_hw_params()函数，其实应该发生了两种状态的转变为：首先由 SND_PCM_STATE_OPEN 变为 SND_PCM_STATE_SETUP 状态、再由 SND_PCM_STATE_SETUP 变为 SND_PCM_STATE_PREPARED 状态。

SND_PCM_STATE_RUNNING

该状态表示设备正在运行，譬如正在播放、正在录音。

上小节我们提到，应用程序可以调用 snd_pcm_start()函数以启动 PCM 设备，启动成功之后，设备开始播放或采集，此时设备处于 SND_PCM_STATE_RUNNING 状态。

此外，当设备处于 SND_PCM_STATE_PREPARED 状态时，应用程序调用 snd_pcm_readi/snd_pcm_writei进行读写数据时，这些函数内部会自动调用 snd_pcm_start()函数；譬如播放模式下，调用 snd_pcm_writei 写入数据后，会自动开启 PCM 设备进行播放，这里要注意，一定是在数据写入到环形缓冲区之后、才开启 PCM设备播放音频，因为一旦开启之后，环形缓冲区中必须要有至少一个周期的数据可供音频设备播放，否则将会发生欠载（underrun）、函数调用以错误形式返回；在录音模式下，调用 snd_pcm_readi()函数后，自动开启 PCM 进行音频采集。

所以这就是为什么示例代码 28.5.1、示例代码 28.5.2、示例代码 28.6.1 这几个示例中并没有调用 snd_pcm_start()函数的原因。

当设备处于运行状态时，应用程序可调用 snd_pcm_drop()或 snd_pcm_drain()函数使设备停止运行，譬如停止播放、停止音频采集；它们的函数原型如下所示：
int snd_pcm_drain(snd_pcm_t *pcm);

int snd_pcm_drop(snd_pcm_t *pcm);
函数调用成功返回 0；失败返回负值错误码。

这两个函数都可使设备停止运行，它们的区别如下：

⚫ snd_pcm_drop()函数将立即停止 PCM，丢弃挂起的帧；

⚫ snd_pcm_drain()函数并不会立即停止 PCM，而是处理完挂起的帧之后再停止 PCM；对于播放，会等待所有待播放的帧播放完毕（应该就是环形缓冲区中的待播放数据），然后停止 PCM；对于录音，停止 PCM 之前会检索残留帧。

当调用 snd_pcm_drop()或 snd_pcm_drain()停止 PCM 设备后，设备将回到 SND_PCM_STATE_SETUP 状态。

SND_PCM_STATE_XRUN

当发生 XRUN 时，设备会处于 SND_PCM_STATE_XRUN 状态，XRUN 前面给大家解释过了，这里不再重述！当处于 SND_PCM_STATE_XRUN 状态时，应用程序可以调用 snd_pcm_prepare()使设备恢复，使其回到 SND_PCM_STATE_PREPARED 状态。

SND_PCM_STATE_DRAINING

这个状态笔者没弄清楚，alsa-lib 文档中的解释为“Draining: running (playback) or stopped (capture)”。

SND_PCM_STATE_PAUSED

ause 就是暂停的意思，所以该状态表示设备处于暂停状态。譬如当设备正在运行时（也就是处于SND_PCM_STATE_RUNNING 状态），应用程序调用 snd_pcm_pause()函数可让设备暂停，其函数原型如下

所示：
int snd_pcm_pause(snd_pcm_t *pcm, int enable);
函数 snd_pcm_pause() 既可以使的设备暂停、同样也可使其恢复（从暂停恢复运行，即 SND_PCM_STATE_RUNNING--->SND_PCM_STATE_RUNNING），通过参数 enable 控制；当 enable 等于1，表示使设备暂停；enable 等于 0 表示使设备恢复运行。

snd_pcm_pause()函数调用成功返回 0；失败返回一个负值错误码。

这里有个问题需要注意，并不是所有的音频设备硬件上支持暂停的功能，可以通过 snd_pcm_hw_params_can_pause()函数来判断设备是否支持暂停，其函数原型如下所示：
int snd_pcm_hw_params_can_pause(const snd_pcm_hw_params_t *params);
函数返回 1 表示硬件支持暂停；返回 0 表示硬件不支持暂停。

SND_PCM_STATE_SUSPENDED

该状态表示硬件已经挂起 suspended，如果硬件发生了挂起，应用程序可以调用 snd_pcm_resume()函数从挂起中恢复，并确保不会丢失样本数据（精细恢复）。snd_pcm_resume()函数原型如下所示：
int snd_pcm_resume(snd_pcm_t *pcm);
函数调用成功返回 0；失败返回一个负值错误码。

当然，并非所有硬件都支持此功能，可以调用 snd_pcm_hw_params_can_resume()函数判断硬件是否支持从挂起中恢复，其函数原型如下所示：
int snd_pcm_hw_params_can_resume(const snd_pcm_hw_params_t *params);
函数调用返回 1 表示支持，返回 0 表示不支持。

SND_PCM_STATE_DISCONNECTED

该状态表示硬件已经断开连接。

状态之间的转换

通过上面的介绍，我们已经知道了 PCM 设备的几种不同的状态、以及它们的一个转换关系，为了能够加深大家的印象，笔者对其进行了整理，主要整理了 SND_PCM_STATE_OPEN、SND_PCM_STATE_SETUP、 SND_PCM_STATE_PREPARED 、 SND_PCM_STATE_RUNNING 、 SND_PCM_STATE_XRUN以及 SND_PCM_STATE_PAUSED 这 6 种状态之间的转换关系，如下图所示：

笔者尽力了！这图画的还是有点乱，不过没关系，状态转换还是描述清楚了。其实这个状态之间的转换关系不难理解，哪种状态能转哪种状态、哪种状态不能转哪种状态，这个还是很容易理解的。这里笔者就不再多说了。

PCM 播放示例代码-加入状态控制

通过上面的介绍，我们已经知道了 PCM 设备不同状态之间转换，譬如播放音乐时，如何暂停、如何停止、又如何恢复。本小节我们来编写一个 PCM 播放程序，在示例代码 28.6.1 的基础上，加入对播放过程的控制，譬如用户按下空格键可以暂停播放、再次按下空格则恢复播放。

示例代码笔者已经写好，如下所示。

本例程源码对应的路径为：开发板光盘 ->11 、 Linux C 应用编程例程源码 ->28_alsalib->pcm_playback_ctl.c
直接参考正点原子开发手册
上述示例程序是在示例代码 28.6.1 基础上进行修改了，加入了用户控制单元，程序设定：

⚫ q：在终端按下 q 键退出应用程序；

⚫ 终端按下空格键暂停播放，再次按下恢复播放。

下面给大家简单地介绍下上述示例代码的设计，在 main()函数中，我们首先屏蔽了 SIGIO 信号，如下：
/* 屏蔽 SIGIO 信号 */
sigemptyset(&sset);
sigaddset(&sset, SIGIO);
sigprocmask(SIG_BLOCK, &sset, NULL);
这主要是为了程序设计上的安全考虑，等把环形缓冲区填满数据之后，再取消 SIGIO 信号屏蔽。当然，你也可以不这样做。

接着打开用户传入的音频文件、初始化 PCM 播放设备、申请应用程序所需的缓冲区：
/* 打开 WAV 音频文件 */
if (open_wav_file(argv[1]))
    exit(EXIT_FAILURE);

/* 初始化 PCM Playback 设备 */
if (snd_pcm_init())
    goto err1;

/* 申请读缓冲区 */
buf = malloc(buf_bytes);
if (NULL == buf) {
    perror("malloc error");
    goto err2;
}
接着对终端进行设置，将终端配置为非规范模式、取消回显，配置为非规范模式之后，用户输入的字符会直接被应用程序读取到，而无需按下回车键；取消回显，意味着用户输入的字符，在终端不会显示出来，这些内容在串口应用编程章节给大家详细介绍过，这里就不再啰嗦！
/* 终端配置 */
tcgetattr(STDIN_FILENO, &old_cfg); //获取终端<标准输入-标准输出构成了一套终端>
memcpy(&new_cfg, &old_cfg, sizeof(struct termios));//备份
new_cfg.c_lflag &= ~ICANON; //将终端设置为非规范模式
new_cfg.c_lflag &= ~ECHO; //禁用回显
tcsetattr(STDIN_FILENO, TCSANOW, &new_cfg);//使配置生效
接下来将数据写入环形缓冲区，开始播放。

取消 SIGIO 信号信号屏蔽。

最后进入 for()循环中，通过 getchar()读取用户输入的字符，用户输入 q 时退出程序，这里需要注意，退出程序时需要调用 tcsetattr()将终端配置参数恢复到之前的状态，否则你的终端将可能会出现下面这种情况：

这个时候你就只能重启了。

用户输入空格暂停或恢复，调用 snd_pcm_pause()实现暂停/恢复。

代码比较简单，笔者也就不再多说了！

编译示例代码

执行命令编译应用程序：

{CC} -o testApp testApp.c -lasound

测试应用程序

将编译得到的可执行文件拷贝到开发板 Linux 系统/home/root 目录下，并准备一个 WAV 音频文件，接着我们执行测试程序：

运行之后，开始播放音乐，此时我们可以通过空格键来暂停播放、再按空格键恢复播放，按 q 键退出程序，大家自己去测试。

Tips：本测试程序不能放在后台运行，一旦放入后台，程序将停止（不是终止、是暂停运行），因为这个程序在设计逻辑上就不符合放置在后台，因为程序中会读取用户从终端（标准输入）输入的字符，如果放入后台，那用户输入的字符就不可能被该程序所读取到，这是其一；其二，程序中修改了终端的配置。

snd_pcm_readi/snd_pcm_writei 错误处理

当 snd_pcm_readi/snd_pcm_writei 调用出错时，会返回一个小于 0（负值）的错误码，可调用 snd_strerror()函数获取对应的错误描述信息。前面的示例代码中我们并没有对 snd_pcm_readi/snd_pcm_writei 的错误返回做过多、细节的处理，而是简单地在出错之后退出。

事实上，当调用 snd_pcm_readi/snd_pcm_writei 出错时，可根据不同的情况作进一步的处理，在 alsa-lib文档中有介绍到，snd_pcm_readi/snd_pcm_writei 函数的不同错误返回值，表示不同的含义，如下所示：

nd_pcm_readi()函数与它相同。

当返回值等于-EBADFD，表示 PCM 设备的状态不对，因为执行 snd_pcm_readi/snd_pcm_writei 读取/写入数据需要 PCM 设备处于 SND_PCM_STATE_PREPARED 或 SND_PCM_STATE_RUNNING 状态，前面已经详细地给大家介绍了 PCM 设备的状态间转换问题。

当返回值等于-EPIPE，表示发生了 XRUN，此时可以怎么做呢？这个可以根据自己的实际需要进行处理，譬如调用 snd_pcm_drop()停止 PCM 设备，或者调用 snd_pcm_prepare()使设备恢复进入准备状态。

当返回值等于-ESTRPIPE，表示硬件发生了挂起，此时 PCM 设备处于 SND_PCM_STATE_SUSPENDED状态，譬如你可以调用 snd_pcm_resume()函数从挂起中精确恢复，如果硬件不支持，还可调用snd_pcm_prepare()函数使设备进入准备状态，或者执行其它的处理，根据应用需求的进行相应的处理。

以上给大家介绍了调用 snd_pcm_readi/snd_pcm_writei 函数出错时的一些情况以及可以采取的一些措施！

总结

本章我们学习了 Linux 下的音频应用编程，应用程序基于 alsa-lib 库实现播放、录音等功能，本章并没有做过多深入的学习，仅仅只是给大家介绍了 alsa-lib 库函数中一些基本的 API 接口，其中还有绝大部分的接口并没有给大家介绍，如果大家有兴趣，可以自己深入研究、学习！

魔乐社区

魔乐社区（Modelers.cn) 是一个中立、公益的人工智能社区，提供人工智能工具、模型、数据的托管、展示与应用协同服务，为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作，由全产业链共同建设、共同运营、共同享有，推动国产AI生态繁荣发展。

更多推荐

Pont - 搭建前后端之桥：高效、灵活的接口管理工具

Pont 是一款强大的数据服务层解决方案，它能够帮助开发者快速搭建前后端之间的桥梁，实现接口的高效管理和代码自动生成。无论是新手还是有经验的开发者，都能通过 Pont 轻松处理接口文档、生成类型安全的 API 代码，从而显著提升开发效率。[![Pont 工具标志](https://raw.gitcode.com/gh_mirrors/po/pont/raw/3f1b7d4bbba3fd2dda

魔乐社区

如何快速上手 hvac：HashiCorp Vault Python 客户端零基础入门指南

**hvac** 是 HashiCorp Vault 的 Python 3.X 客户端库，专为开发者提供简单高效的 Vault 交互方式。无论你是需要管理密钥、配置身份验证，还是实现安全的秘密数据存储，hvac 都能帮助你轻松搞定 Vault 的各项操作。本文将带你零基础快速入门，从安装到基础操作，让你在几分钟内即可上手使用这个强大的工具。[![hvac 客户端 Logo](https://r

魔乐社区

提升Angular2-HN性能的7个实用技巧：让新闻加载速度飞起来

Angular2-HN是一款基于Angular构建的Progressive Hacker News客户端，专为追求高效新闻浏览体验的用户设计。本文将分享7个实用技巧，帮助你优化Angular2-HN的性能，让新闻加载速度显著提升，带来更流畅的阅读体验。## 1. 启用Service Worker缓存关键资源Service Worker是提升Angular应用性能的强大工具，它可以在后台缓存