Linux-音频应用编程
系统下一套标准的、先进的音频驱动框架,那么这套框架的设计本身是比较复杂的,采用分离、分层思想设计而成,具体的细节便不给大家介绍了!提供的接口确实非常多、模块很多,以上所列举出来的这些模块,很多模块笔者也不是很清楚它们的具体功能、作用,但是本章我们仅涉及到三个模块下的 API。提供的库函数也别多,笔者肯定不会全部给大家介绍,只介绍基础的使用方法,关于更加深入、更加详细的使用方法需要大家自己去研究、学
直接参考正点原子开发手册即可,本文仅作为个人学习记录使用。
ALPHA I.MX6U 开发板支持音频,板上搭载了音频编解码芯片 WM8960,支持播放以及录音功能!本章我们来学习 Linux 下的音频应用编程,音频应用编程相比于前面几个章节所介绍的内容、其难度有所上升,但是笔者仅向大家介绍 Linux 音频应用编程中的基础知识,而更多细节、更加深入的内容需要大家自己去学习。
本章将会讨论如下主题内容。
⚫ Linux 下 ALSA 框架概述;
⚫ alsa-lib 库介绍;
⚫ alsa-lib 库移植;
⚫ alsa-lib 库的使用;
⚫ 音频应用编程之播放;
⚫ 音频应用编程之录音。
ALSA 概述
ALSA 是 Advanced Linux Sound Architecture(高级的 Linux音频架构)的缩写,目前已经成为了 linux下的主流音频体系架构,提供了音频和 MIDI 的支持,替代了原先旧版本中的 OSS(开发声音系统);学习过 Linux 音频驱动开发的读者肯定知道这个;事实上,ALSA 是 Linux 系统下一套标准的、先进的音频驱动框架,那么这套框架的设计本身是比较复杂的,采用分离、分层思想设计而成,具体的细节便不给大家介绍了!作为音频应用编程,我们不用去研究这个。
在应用层,ALSA 为我们提供了一套标准的 API,应用程序只需要调用这些 API 就可完成对底层音频硬件设备的控制,譬如播放、录音等,这一套 API 称为 alsa-lib。如下图所示:
alsa-lib 简介
如上所述,alsa-lib 是一套 Linux 应用层的 C 语言函数库,为音频应用程序开发提供了一套统一、标准的接口,应用程序只需调用这一套 API 即可完成对底层声卡设备的操控,譬如播放与录音。
用户空间的 alsa-lib 对应用程序提供了统一的 API 接口,这样可以隐藏驱动层的实现细节,简化了应用程序的实现难度、无需应用程序开发人员直接去读写音频设备节点。所以本章,对于我们来说,学习音频应用编程其实就是学习 alsa-lib 库函数的使用、如何基于 alsa-lib 库函数开发音频应用程序。
ALSA 提供了关于 alsa-lib 的使用说明文档,其链接地址为:https://www.alsa-project.org/alsa-doc/alsa-lib/,
进入到该链接地址后,如下所示:
alsa-lib 库支持功能比较多,提供了丰富的 API 接口供应用程序开发人员调用,根据函数的功能、作用将这些 API 进行了分类,可以点击上图中 Modules 按钮查看其模块划分,如下所示:
一个分类就是一个模块(module),有些模块下可能该包含了子模块,譬如上图中,模块名称前面有三角箭头的表示该模块包含有子模块。
⚫ Global defines and functions:包括一些全局的定义,譬如函数、宏等;
⚫ Constants for Digital Audio Interfaces:数字音频接口相关的常量;
⚫ Input Interface:输入接口;
⚫ Output Interface:输出接口;
⚫ Error handling:错误处理相关接口;
⚫ Configuration Interface:配置接口;
⚫ Control Interface:控制接口;
⚫ PCM Interface:PCM 设备接口;
⚫ RawMidi Interface:RawMidi 接口;
⚫ Timer Interface:定时器接口;
⚫ Hardware Dependant Interface:硬件相关接口;
⚫ MIDI Sequencer:MIDI 音序器;
⚫ External PCM plugin SDK:外部 PCM 插件 SDK;
⚫ External Control Plugin SDK:外部控制插件 SDK;
⚫ Mixer Interface:混音器接口;
⚫ Use Case Interface:用例接口;
⚫ Topology Interface:拓扑接口。
可以看到,alsa-lib 提供的接口确实非常多、模块很多,以上所列举出来的这些模块,很多模块笔者也不是很清楚它们的具体功能、作用,但是本章我们仅涉及到三个模块下的 API 函数,包括:PCM Interface、Error Interface 以及 Mixer Interface。
PCM Interface
PCM Interface,提供了 PCM 设备相关的操作接口,譬如打开/关闭 PCM 设备、配置 PCM 设备硬件或软件参数、控制 PCM 设备(启动、暂停、恢复、写入/读取数据),该模块下还包含了一些子模块,如下所示:
点击模块名称可以查看到该模块提供的API接口有哪些以及相应的函数说明,这里就不给大家演示了!
Error Interface
该模块提供了关于错误处理相关的接口,譬如函数调用发生错误时,可调用该模块下提供的函数打印错误描述信息。
Mixer Interface
提供了关于混音器相关的一系列操作接口,譬如音量、声道控制、增益等等。
sound设备节点
在 Linux 内核设备驱动层、基于 ALSA 音频驱动框架注册的 sound 设备会在/dev/snd 目录下生成相应的设备节点文件,譬如 ALPHA I.MX6U 开发板出厂系统/dev/snd 目录下有如下文件:
Tips:注意,Mini I.MX6U 开发板出厂系统/dev/snd 目录下是没有这些文件的,因为 Mini 板不支持音频、没有板载音频编解码芯片,所以本章实验例程无法在 Mini 板上进行测试,请悉知!
从上图可以看到有如下设备文件:
⚫ controlC0:用于声卡控制的设备节点,譬如通道选择、混音器、麦克风的控制等,C0 表示声卡 0(card0);
⚫ pcmC0D0c:用于录音的 PCM 设备节点。其中 C0 表示 card0,也就是声卡 0;而 D0 表示 device0,也就是设备 0;最后一个字母 c 是 capture 的缩写,表示录音;所以 pcmC0D0c 便是系统的声卡0 中的录音设备 0;
⚫ pcmC0D0p:用于播放(或叫放音、回放)的 PCM 设备节点。其中 C0 表示 card0,也就是声卡 0;而 D0 表示 device 0,也就是设备 0;最后一个字母 p 是 playback 的缩写,表示播放;所以 pcmC0D0p便是系统的声卡 0 中的播放设备 0;
⚫ pcmC0D1c:用于录音的 PCM 设备节点。对应系统的声卡 0 中的录音设备 1;
⚫ pcmC0D1p:用于播放的 PCM 设备节点。对应系统的声卡 0 中的播放设备 1。
⚫ timer:定时器。
本章我们编写的应用程序,虽然是调用 alsa-lib 库函数去控制底层音频硬件,但最终也是落实到对 sound设备节点的 I/O 操作,只不过 alsa-lib 已经帮我们封装好了。在 Linux 系统的/proc/asound 目录下,有很多的文件,这些文件记录了系统中声卡相关的信息,如下所示:
cards:
通过"cat /proc/asound/cards"命令、查看 cards 文件的内容,可列出系统中可用的、注册的声卡,如下所示:
cat /proc/asound/cards
我们的阿尔法板子上只有一个声卡(WM8960 音频编解码器),所以它的编号为 0,也就是 card0。系统中注册的所有声卡都会在/proc/asound/目录下存在一个相应的目录,该目录的命名方式为 cardX(X 表示 声卡的编号),譬如图 28.3.2 中的 card0;card0 目录下记录了声卡 0 相关的信息,譬如声卡的名字以及声卡注册的 PCM 设备,如下所示:
devices:
列出系统中所有声卡注册的设备,包括 control、pcm、timer、seq 等等。如下所示:
cat /proc/asound/devices
pcm:
列出系统中的所有 PCM 设备,包括 playback 和 capture:
cat /proc/asound/pcm
alsa-lib移植
因为 alsa-lib 是 ALSA 提供的一套 Linux 下的 C 语言函数库,需要将 alsa-lib 移植到开发板上,这样基于 alsa-lib 编写的应用程序才能成功运行,除了移植 alsa-lib 库之外,通常还需要移植 alsa-utils,alsa-utils 包含了一些用于测试、配置声卡的工具。
事实上,ALPHA I.MX6U 开发板出厂系统中已经移植了 alsa-lib 和 alsa-utils,本章我们直接使用出厂系统移植好的 alsa-lib 和 alsa-utils 进行测试,笔者也就不再介绍移植过程了。其实它们的移植方法也非常简单,如果你想自己尝试移植,网上有很多参考,大家可以自己去看看。
alsa-utils 提供了一些用于测试、配置声卡的工具,譬如 aplay、arecord、alsactl、alsaloop、alsamixer、amixer 等,在开发板出厂系统上可以直接使用这些工具,这些应用程序也都是基于 alsa-lib 编写的。
aplay
aplay 是一个用于测试音频播放功能程序,可以使用 aplay 播放 wav 格式的音频文件,如下所示:
程序运行之后就会开始播放音乐,因为 ALPHA 开发板支持喇叭和耳机自动切换,如果不插耳机默认从喇叭播放音乐,插上耳机以后喇叭就会停止播放,切换为耳机播放音乐,这个大家可以自己进行测试。
需要注意的是,aplay 工具只能解析 wav 格式音频文件,不支持 mp3 格式解码,所以无法使用 aplay 工具播放 mp3 音频文件。稍后笔者会向大家介绍如何基于 alsa-lib 编写一个简单地音乐播放器,实现与 aplay相同的效果。
更多命令参考正电原子应用开发手册即可。
暂略。
编写一个简单的alsa-lib应用程序
本小节开始,我们来学习如何基于 alsa-lib 编写音频应用程序,alsa-lib 提供的库函数也别多,笔者肯定不会全部给大家介绍,只介绍基础的使用方法,关于更加深入、更加详细的使用方法需要大家自己去研究、学习。
对于 alsa-lib 库的使用,ALSA 提供了一些参考资料来帮助应用程序开发人员快速上手 alsa-lib、基于alsa-lib 进行应用编程,以下笔者给出了链接:
https://users.suse.com/~mana/alsa090_howto.html
https://www.alsa-project.org/alsa-doc/alsa-lib/examples.html
第一份文档向用户介绍了如何使用 alsa-lib 编写简单的音频应用程序,包括 PCM 播放音频、PCM 录音等,笔者也是参考了这份文档来编写本章教程,对应初学者,建议大家看一看。
第二个链接地址是 ALSA 提供的一些示例代码,如下所示:
点击对应源文件即可查看源代码。
以上便是 ALSA 提供的帮助文档以及参考代码,链接地址已经给出了,大家有兴趣可以看一下。
本小节笔者将向大家介绍如何基于 alsa-lib 编写一个简单地音频应用程序,譬如播放音乐、录音等;但在此之前,首先我们需要先来了解一些基本的概念,为后面的学习打下一个坚实的基础!
一些基本概念
主要是与音频相关的基本概念,因为在 alsa-lib 应用编程中会涉及到这些概念,所以先给大家进行一个简单地介绍。
样本长度(Sample)
样本是记录音频数据最基本的单元,样本长度就是采样位数,也称为位深度(Bit Depth、Sample Size、Sample Width)。是指计算机在采集和播放声音文件时,所使用数字声音信号的二进制位数,或者说每个采样样本所包含的位数(计算机对每个通道采样量化时数字比特位数),通常有 8bit、16bit、24bit 等。
声道数(channel)
分为单声道(Mono)和双声道/立体声(Stereo)。1 表示单声道、2 表示立体声。
帧(frame)
帧记录了一个声音单元,其长度为样本长度与声道数的乘积,一段音频数据就是由苦干帧组成的。
把所有声道中的数据加在一起叫做一帧,对于单声道:一帧 = 样本长度 * 1;双声道:一帧 = 样本长度 * 2。譬如对于样本长度为 16bit 的双声道来说,一帧的大小等于:16 * 2 / 8 = 4 个字节。
采样率(Sample rate)
也叫采样频率,是指每秒钟采样次数,该次数是针对桢而言。譬如常见的采样率有:
8KHz:电话所用采样率
22.05KHz:FM 调频广播所用采样率
44.1KHz:音频 CD,也常用于 MPEG-1 音频(VCD、SVCD、MP3)所用采样率
48KHz:miniDV、数字电视、DVD、DAT、电影和专业音频所用的数字声音所用采样率。
交错模式(interleaved)
交错模式是一种音频数据的记录方式,分为交错模式和非交错模式。在交错模式下,数据以连续桢的形式存放,即首先记录完桢 1 的左声道样本和右声道样本(假设为立体声格式),再记录桢 2 的左声道样本和右声道样本。而在非交错模式下,首先记录的是一个周期内所有桢的左声道样本,再记录右声道样本,数据是以连续通道的方式存储。不过多数情况下,我们一般都是使用交错模式。
周期(period)
周期是音频设备处理(读、写)数据的单位,换句话说,也就是音频设备读写数据的单位是周期,每一次读或写一个周期的数据,一个周期包含若干个帧;譬如周期的大小为 1024 帧,则表示音频设备进行一次读或写操作的数据量大小为 1024 帧,假设一帧为 4 个字节,那么也就是 1024*4=4096 个字节数据。
一个周期其实就是两次硬件中断之间的帧数,音频设备每处理(读或写)完一个周期的数据就会产生一个中断,所以两个中断之间相差一个周期,关于中断的问题,稍后再向大家介绍!
缓冲区(buffer)
数据缓冲区,一个缓冲区包含若干个周期,所以 buffer 是由若干个周期所组成的一块空间。下面一张图直观地表示了 buffer、period、frame、sample(样本长度)之间的关系,假设一个 buffer 包含 4 个周期、而一个周包含 1024 帧、一帧包含两个样本(左、右两个声道):
音频设备底层驱动程序使用 DMA 来搬运数据,这个 buffer 中有 4 个 period,每当 DMA 搬运完一个period 的数据就会触发一次中断,因此搬运整个 buffer 中的数据将产生 4 次中断。ALSA 为什么这样做?直接把整个 buffer 中的数据一次性搬运过去岂不是更快?情况并非如此,我们没有考虑到一个很重要的问题,那就是延迟;如果数据缓存区 buffer 很大,一次传输整个 buffer 中的数据可能会导致不可接受的延迟,因为一次搬运的数据量越大,所花费的时间就越长,那么必然会导致数据从传输开始到发出声音(以播放为例)这个过程所经历的时间就会越长,这就是延迟。为了解决这个问题,ALSA 把缓存区拆分成多个周期,以周期为传输单元进行传输数据。
所以,周期不宜设置过大,周期过大会导致延迟过高;但周期也不能太小,周期太小会导致频繁触发中断,这样会使得 CPU 被频繁中断而无法执行其它的任务,使得效率降低!所以,周期大小要合适,在延迟可接受的情况下,尽量设置大一些,不过这个需要根据实际应用场合而定,有些应用场合,可能要求低延迟、实时性高,但有些应用场合没有这种需求。
数据之间的传输
这里再介绍一下数据之间传输的问题,这个问题很重要,大家一定要理解,这样会更好的帮助我们理解代码、理解代码的逻辑。
⚫ PCM 播放情况下
在播放情况下,buffer 中存放了需要播放的 PCM 音频数据,由应用程序向 buffer 中写入音频数据,buffer中的音频数据由 DMA 传输给音频设备进行播放,所以应用程序向 buffer 写入数据、音频设备从 buffer 读取数据,这就是 buffer 中数据的传输情况。
图 28.5.2 中标识有 read pointer 和 write pointer 指针,write pointer 指向当前应用程序写 buffer 的位置、read pointer 指向当前音频设备读 buffer 的位置。在数据传输之前(播放之前),buffer 缓冲区是没有数据的,此时 write/read pointer 均指向了 buffer 的起始位置,也就是第一个周期的起始位置,如下所示:
应用程序向 buffer 写入多少帧数据,则 write pointer 指针向前移动多少帧,当应用程序向 buffer 中写入一个周期的数据时,write pointer 指针将向前移动一个周期;接着再写入一个周期,指针再向前移动一个周期,以此类推!当 write pointer 移动到 buffer 末尾时,又会回到 buffer 的起始位置,以此循环!所以由此可知,这是一个环形缓冲区。
以上是应用程序写 buffer 的一个过程,接着再来看看音频设备读 buffer(播放)的过程。在播放开始之前,read pointer 指向了 buffer 的起始位置,也就是第一个周期的起始位置。音频设备每次只播放一个周期的数据(读取一个周期),每一次都是从 read pointer 所指位置开始读取;每读取一个周期,read pointer 指针向前移动一个周期,同样,当 read pointer 指针移动到 buffer 末尾时,又会回到 buffer 的起始位置,以此构成一个循环!
应用程序需要向 buffer 中写入音频数据,音频设备才能读取数据进行播放,如果 read pointer 所指向的周期并没有填充音频数据,则无法播放!当 buffer 数据满时,应用程序将不能再写入数据,否则就会覆盖之前的数据,必须要等待音频设备播放完一个周期,音频设备每播放完一个周期,这个周期就变成空闲状态了,此时应用程序就可以写入一个周期的数据以填充这个空闲周期。
⚫ PCM 录音情况下
在录音情况下,buffer 中存放了音频设备采集到的音频数据(外界模拟声音通过 ADC 转为数字声音),由音频设备向 buffer 中写入音频数据(DMA 搬运),而应用程序从 buffer 中读取数据,所以音频设备向buffer 写入数据、应用程序从 buffer 读取数据,这就是录音情况下 buffer 中数据的传输情况。
回到图 28.5.2 中,此时 write pointer 指向音频设备写 buffer 的位置、read pointer 指向应用程序读 buffer的位置。在录音开始之前,buffer 缓冲区是没有数据的,此时 write/read pointer 均指向了 buffer 的起始位置,也就是第一个周期的起始位置,如图 28.5.3 中所示。
音频设备向 buffer 写入多少帧数据,则 write pointer 指针向前移动多少帧,音频设备每次只采集一个周期,将采集到的数据写入 buffer 中,从 write pointer 所指位置开始写入;当音频设备向 buffer 中写入一个周期的数据时,write pointer 指针将向前移动一个周期;接着再写入一个周期,指针再向前移动一个周期,以此类推!当 write pointer 移动到 buffer 末尾时,又会回到 buffer 的起始位置,以此构成循环!
以上是音频设备写 buffer 的一个过程,接着再来看看应用程序读 buffer 的过程。在录音开始之前,read pointer 指向了 buffer 的起始位置,也就是第一个周期的起始位置。同样,应用程序从 buffer 读取了多少帧数据,则 read pointer 指针向前移动多少帧;从 read pointer 所指位置开始读取,当 read pointer 指针移动到buffer 末尾时,又会回到 buffer 的起始位置,以此构成一个循环!
音频设备需要向 buffer 中写入音频数据,应用程序才能从 buffer 中读取数据(录音),如果 read pointer所指向的周期并没有填充音频数据,则无法读取!当 buffer 中没有数据时,需要等待音频设备向 buffer 中写入数据,音频设备每次写入一个周期,当应用程序读取完这个周期的数据后,这个周期又变成了空闲周期,需要等待音频设备写入数据。
Over and Under Run
当一个声卡处于工作状态时,环形缓冲区 buffer 中的数据总是连续地在音频设备和应用程序缓存区间传输,如下图所示:
上图展示了声卡在工作状态下,buffer 中数据的传输情况,总是连续地在音频设备和应用程序缓存区间传输,但事情并不总是那么完美、也会出现有例外;譬如在录音例子中,如果应用程序读取数据不够快,环形缓冲区 buffer 中的数据已经被音频设备写满了、而应用程序还未来得及读走,那么数据将会被覆盖;这种数据的丢失被称为 overrun。在播放例子中,如果应用程序写入数据到环形缓冲区 buffer 中的速度不够快,缓存区将会“饿死”(缓冲区中无数据可播放);这样的错误被称为 underrun(欠载)。在 ALSA 文档中,将这两种情形统称为"XRUN",适当地设计应用程序可以最小化 XRUN 并且可以从中恢复过来。
打开 PCM 设备
从本小节开始,将正式介绍如何编写一个音频应用程序,首先我们需要在应用程序中包含 alsa-lib 库的头文件<alsa/asoundlib.h>,这样才能在应用程序中调用 alsa-lib 库函数以及使用相关宏。
第一步需要打开 PCM 设备,调用函数 snd_pcm_open(),该函数原型如下所示:
int snd_pcm_open(snd_pcm_t **pcmp, const char *name, snd_pcm_stream_t stream, int mode)该函数一共有 4 个参数,如下所示:
- pcmp:snd_pcm_t 用于描述一个 PCM 设备,所以一个 snd_pcm_t 对象表示一个 PCM 设备;snd_pcm_open 函数会打开参数 name 所指定的设备,实例化 snd_pcm_t 对象,并将对象的指针(也就是 PCM 设备的句柄)通过 pcmp 返回出来。
- name:参数 name 指定 PCM 设备的名字。alsa-lib 库函数中使用逻辑设备名而不是设备文件名,命名方式为"hw:i,j",i 表示声卡的卡号,j 则表示这块声卡上的设备号;譬如"hw:0,0"表示声卡 0 上的PCM 设备 0,在播放情况下,这其实就对应/dev/snd/pcmC0D0p(如果是录音,则对应/dev/snd/pcmC0D0c)。除了使用"hw:i,j"这种方式命名之外,还有其它两种常用的命名方式,譬如"plughw:i,j"、"default"等,关于这些名字的不同,本章最后再向大家进行简单地介绍,这里暂时先不去理会这个问题。
- stream:参数 stream 指定流类型,有两种不同类型:SND_PCM_STREAM_PLAYBACK 和 SND_PCM_STREAM_CAPTURE ; SND_PCM_STREAM_PLAYBACK 表 示 播 放 ,SND_PCM_STREAM_CAPTURE 则表示采集。
- mode:最后一个参数 mode 指定了 open 模式,通常情况下,我们会将其设置为 0,表示默认打开模式,默认情况下使用阻塞方式打开设备;当然,也可将其设置为 SND_PCM_NONBLOCK,表示以非阻塞方式打开设备。
设备打开成功,snd_pcm_open 函数返回 0;打开失败,返回一个小于 0 的错误编号,可以使用 alsa-lib提供的库函数 snd_strerror()来得到对应的错误描述信息,该函数与 C 库函数 strerror()用法相同。
与 snd_pcm_open 相对应的是 snd_pcm_close(),函数 snd_pcm_close()用于关闭 PCM 设备,函数原型如下所示:
int snd_pcm_close(snd_pcm_t *pcm);使用示例:
调用 snd_pcm_open()函数打开声卡 0 的 PCM 播放设备 0:
snd_pcm_t *pcm_handle = NULL; int ret; ret = snd_pcm_open(&pcm_handle, "hw:0,0", SND_PCM_STREAM_PLAYBACK, 0); if (0 > ret) { fprintf(stderr, "snd_pcm_open error: %s\n", snd_strerror(ret)); return -1; }以上是打开和关闭PCM设备。
设置硬件参数
打开 PCM 设备之后,接着我们需要对设备进行设置,包括硬件配置和软件配置。软件配置就不再介绍了,使用默认配置即可!我们主要是对硬件参数进行配置,譬如采样率、声道数、格式、访问类型、period周期大小、buffer 大小等。
实例化 snd_pcm_hw_params_t 对象
alsa-lib 使用 snd_pcm_hw_params_t 数据类型来描述 PCM 设备的硬件配置参数,在配置参数之前,我们需 要 实 例 化 一 个 snd_pcm_hw_params_t 对 象 , 使 用snd_pcm_hw_params_malloc 或 snd_pcm_hw_params_alloca()来实例化一个 snd_pcm_hw_params_t 对象,如下所示:
snd_pcm_hw_params_t *hwparams = NULL; snd_pcm_hw_params_malloc(&hwparams); 或 snd_pcm_hw_params_alloca(&hwparams);它们之间的区别也就是 C 库函数 malloc 和 alloca 之间的区别。当然,你也可以直接使用 malloc()或 alloca() 来分配一个 snd_pcm_hw_params_t 对 象 , 亦 或 者 直 接 定 义 全 局 变 量 或 栈 自 动 变 量 。
与 snd_pcm_hw_params_malloc/snd_pcm_hw_params_alloca 相对应的是 snd_pcm_hw_params_free , snd_pcm_hw_params_free()函数用于释放 snd_pcm_hw_params_t 对象占用的内存空间。函数原型如下所示:
void snd_pcm_hw_params_free(snd_pcm_hw_params_t *obj)
初始化 snd_pcm_hw_params_t 对象
snd_pcm_hw_params_t 对 象 实 例 化 完 成 之 后 , 接 着 我 们 需 要 对 其 进 行 初 始 化 操 作 , 调 用 snd_pcm_hw_params_any()对 snd_pcm_hw_params_t 对象进行初始化操作,调用该函数会使用 PCM 设备当前的配置参数去初始化 snd_pcm_hw_params_t 对象,如下所示:
snd_pcm_hw_params_any(pcm_handle, hwparams);第一个参数为 PCM 设备的句柄,第二个参数传入 snd_pcm_hw_params_t 对象的指针。
对硬件参数进行设置
alsa-lib 提供了一系列的 snd_pcm_hw_params_set_xxx 函数用于设置 PCM 设备的硬件参数,同样也提供
了一系列的 snd_pcm_hw_params_get_xxx 函数用于获取硬件参数。
(1)设置 access 访问类型:snd_pcm_hw_params_set_access()
调用 snd_pcm_hw_params_set_access 设置访问类型,其函数原型如下所示:
int snd_pcm_hw_params_set_access(snd_pcm_t *pcm, snd_pcm_hw_params_t * params, snd_pcm_access_t access )参数 access 指定设备的访问类型,是一个 snd_pcm_access_t 类型常量,这是一个枚举类型,如下所示:
enum snd_pcm_access_t { SND_PCM_ACCESS_MMAP_INTERLEAVED = 0, //mmap access with simple interleaved channels SND_PCM_ACCESS_MMAP_NONINTERLEAVED, //mmap access with simple non interleaved channels SND_PCM_ACCESS_MMAP_COMPLEX, //mmap access with complex placement SND_PCM_ACCESS_RW_INTERLEAVED, //snd_pcm_readi/snd_pcm_writei access SND_PCM_ACCESS_RW_NONINTERLEAVED, //snd_pcm_readn/snd_pcm_writen access SND_PCM_ACCESS_LAST = SND_PCM_ACCESS_RW_NONINTERLEAVED };通 常 , 将 访 问 类 型 设 置 为 SND_PCM_ACCESS_RW_INTERLEAVED , 交 错 访 问 模 式 , 通 过 snd_pcm_readi/snd_pcm_writei 对 PCM 设备进行读/写操作。
函数调用成功返回 0;失败将返回一个小于 0 的错误码,可通过 snd_strerror()函数获取错误描述信息。
使用示例:
ret = snd_pcm_hw_params_set_access(pcm_handle, hwparams, SND_PCM_ACCESS_RW_INTERLEAVED); if (0 > ret) fprintf(stderr, "snd_pcm_hw_params_set_access error: %s\n", snd_strerror(ret));(2)设置数据格式:snd_pcm_hw_params_set_format()
调用 snd_pcm_hw_params_set_format()函数设置 PCM 设备的数据格式,函数原型如下所示:
nt snd_pcm_hw_params_set_format(snd_pcm_t *pcm, snd_pcm_hw_params_t *params, snd_pcm_format_t format )参数 format 指定数据格式,该参数是一个 snd_pcm_format_t 类型常量,这是一个枚举类型,如下所示:
num snd_pcm_format_t { SND_PCM_FORMAT_UNKNOWN = -1, SND_PCM_FORMAT_S8 = 0, SND_PCM_FORMAT_U8, SND_PCM_FORMAT_S16_LE, SND_PCM_FORMAT_S16_BE, SND_PCM_FORMAT_U16_LE, SND_PCM_FORMAT_U16_BE, SND_PCM_FORMAT_S24_LE, SND_PCM_FORMAT_S24_BE, SND_PCM_FORMAT_U24_LE, SND_PCM_FORMAT_U24_BE, SND_PCM_FORMAT_S32_LE, SND_PCM_FORMAT_S32_BE, SND_PCM_FORMAT_U32_LE, SND_PCM_FORMAT_U32_BE, SND_PCM_FORMAT_FLOAT_LE, SND_PCM_FORMAT_FLOAT_BE, SND_PCM_FORMAT_FLOAT64_LE, SND_PCM_FORMAT_FLOAT64_BE, SND_PCM_FORMAT_IEC958_SUBFRAME_LE, SND_PCM_FORMAT_IEC958_SUBFRAME_BE, SND_PCM_FORMAT_MU_LAW, SND_PCM_FORMAT_A_LAW, SND_PCM_FORMAT_IMA_ADPCM, SND_PCM_FORMAT_MPEG, SND_PCM_FORMAT_GSM, SND_PCM_FORMAT_S20_LE, SND_PCM_FORMAT_S20_BE, SND_PCM_FORMAT_U20_LE, SND_PCM_FORMAT_U20_BE, SND_PCM_FORMAT_SPECIAL = 31, SND_PCM_FORMAT_S24_3LE = 32, SND_PCM_FORMAT_S24_3BE, SND_PCM_FORMAT_U24_3LE, SND_PCM_FORMAT_U24_3BE, SND_PCM_FORMAT_S20_3LE, SND_PCM_FORMAT_S20_3BE, SND_PCM_FORMAT_U20_3LE, SND_PCM_FORMAT_U20_3BE, SND_PCM_FORMAT_S18_3LE, SND_PCM_FORMAT_S18_3BE, SND_PCM_FORMAT_U18_3LE, SND_PCM_FORMAT_U18_3BE, SND_PCM_FORMAT_G723_24, SND_PCM_FORMAT_G723_24_1B, SND_PCM_FORMAT_G723_40, SND_PCM_FORMAT_G723_40_1B, SND_PCM_FORMAT_DSD_U8, SND_PCM_FORMAT_DSD_U16_LE, SND_PCM_FORMAT_DSD_U32_LE, SND_PCM_FORMAT_DSD_U16_BE, SND_PCM_FORMAT_DSD_U32_BE, SND_PCM_FORMAT_LAST = SND_PCM_FORMAT_DSD_U32_BE, SND_PCM_FORMAT_S16 = SND_PCM_FORMAT_S16_LE, SND_PCM_FORMAT_U16 = SND_PCM_FORMAT_U16_LE, SND_PCM_FORMAT_S24 = SND_PCM_FORMAT_S24_LE, SND_PCM_FORMAT_U24 = SND_PCM_FORMAT_U24_LE, SND_PCM_FORMAT_S32 = SND_PCM_FORMAT_S32_LE, SND_PCM_FORMAT_U32 = SND_PCM_FORMAT_U32_LE, SND_PCM_FORMAT_FLOAT = SND_PCM_FORMAT_FLOAT_LE, SND_PCM_FORMAT_FLOAT64 = SND_PCM_FORMAT_FLOAT64_LE, SND_PCM_FORMAT_IEC958_SUBFRAME = SND_PCM_FORMAT_IEC958_SUBFRAME_LE, SND_PCM_FORMAT_S20 = SND_PCM_FORMAT_S20_LE, SND_PCM_FORMAT_U20 = SND_PCM_FORMAT_U20_LE };的最多的格式是 SND_PCM_FORMAT_S16_LE,有符号 16 位、小端模式。当然,音频设备不一定支持用户所指定的格式,在此之前,用户可以调用 snd_pcm_hw_params_test_format()函数测试 PCM 设备是否支持某种格式,如下所示:
if (snd_pcm_hw_params_test_format(pcm_handle, hwparams, SND_PCM_FORMAT_S16_LE)) { // 返回一个非零值 表示不支持该格式 } else { // 返回 0 表示支持 }3)设置声道数:snd_pcm_hw_params_set_channels()
调用 snd_pcm_hw_params_set_channels()函数设置 PCM 设备的声道数,函数原型如下所示:
int snd_pcm_hw_params_set_channels(snd_pcm_t *pcm, snd_pcm_hw_params_t *params, unsigned int val )参数 val 指定声道数量,val=2 表示双声道,也就是立体声。函数调用成功返回 0,失败返回小于 0 的错误码。
使用示例:
ret = snd_pcm_hw_params_set_channels(pcm_handle, hwparams, 2); if (0 > ret) fprintf(stderr, "snd_pcm_hw_params_set_channels error: %s\n", snd_strerror(ret));(4)设置采样率大小:snd_pcm_hw_params_set_rate()
调用 snd_pcm_hw_params_set_rate 设置采样率大小,其函数原型如下所示:
nt snd_pcm_hw_params_set_rate(snd_pcm_t *pcm, snd_pcm_hw_params_t *params, unsigned int val, int dir )参数 val 指定采样率大小,譬如 44100;参数 dir 用于控制方向,若 dir=-1,则实际采样率小于参数 val指定的值;dir=0 表示实际采样率等于参数 val;dir=1 表示实际采样率大于参数 val。
函数调用成功返回 0;失败将返回小于 0 的错误码。
使用示例:
ret = snd_pcm_hw_params_set_rate(pcm_handle, hwparams, 44100, 0); if (0 > ret) fprintf(stderr, "snd_pcm_hw_params_set_rate error: %s\n", snd_strerror(ret));(5)设置周期大小:snd_pcm_hw_params_set_period_size()
这里说的周期,也就是 28.5.1 小节中向大家介绍的周期,一个周期的大小使用帧来衡量,譬如一个周期1024 帧;调用 snd_pcm_hw_params_set_period_size()函数设置周期大小,其函数原型如下所示:
int snd_pcm_hw_params_set_period_size(snd_pcm_t *pcm, snd_pcm_hw_params_t *params, snd_pcm_uframes_t val, int dir )alsa-lib 使用 snd_pcm_uframes_t 类型表示帧的数量;参数 dir 与 snd_pcm_hw_params_set_rate()函数的dir 参数意义相同。
使用示例(将周期大小设置为 1024 帧):
ret = snd_pcm_hw_params_set_period_size(pcm_handle, hwparams, 1024, 0); f (0 > ret) fprintf(stderr, "snd_pcm_hw_params_set_period_size error: %s\n", snd_strerror(ret));注意,参数 val 的单位是帧、而不是字节。
(6)设置 buffer 大小:snd_pcm_hw_params_set_buffer_size()
调用 snd_pcm_hw_params_set_buffer_size()函数设置 buffer 的大小,其函数原型如下所示:
int snd_pcm_hw_params_set_buffer_size(snd_pcm_t *pcm, snd_pcm_hw_params_t *params, snd_pcm_uframes_t val )参数 val 指定 buffer 的大小,以帧为单位,通常 buffer 的大小是周期大小的整数倍,譬如 16 个周期;但函数 snd_pcm_hw_params_set_buffer_size()是以帧为单位来表示 buffer 的大小,所以需要转换一下,譬如将 buffer 大小设置为 16 个周期,则参数 val 等于 16 * 1024(假设一个周期为 1024 帧)=16384 帧。
函数调用成功返回 0;失败返回一个小于 0 的错误码。
使用示例:
ret = snd_pcm_hw_params_set_buffer_size(pcm_handle, hwparams, 16*1024); if (0 > ret) fprintf(stderr, "snd_pcm_hw_params_set_buffer_size error: %s\n", snd_strerror(ret));除了 snd_pcm_hw_params_set_buffer_size()函数之外,我们还可以调用 snd_pcm_hw_params_set_periods()函数设置 buffer 大小,其函数原型如下所示:
nt snd_pcm_hw_params_set_periods(snd_pcm_t *pcm, snd_pcm_hw_params_t *params, unsigned int val, int dir )参数 val 指定了 buffer 的大小,该大小以周期为单位、并不是以帧为单位,注意区分!
参数 dir 与 snd_pcm_hw_params_set_rate()函数的 dir 参数意义相同。
函数调用成功返回 0;失败将返回一个小于 0 的错误码。
使用示例:
ret = snd_pcm_hw_params_set_periods(pcm_handle, hwparams, 16, 0); //buffer 大小为 16 个周期 if (0 > ret) fprintf(stderr, "snd_pcm_hw_params_set_periods error: %s\n", snd_strerror(ret));(7)安装/加载硬件配置参数:snd_pcm_hw_params()
参数设置完成之后,最后调用 snd_pcm_hw_params()加载/安装配置、将配置参数写入硬件使其生效,其函数原型如下所示:
int snd_pcm_hw_params(snd_pcm_t *pcm, snd_pcm_hw_params_t *params)函数调用成功返回 0,失败将返回一个小于 0 的错误码。函数 snd_pcm_hw_params()调用之后,其内部会自动调用 snd_pcm_prepare()函数,PCM 设备的状态被更改为 SND_PCM_STATE_PREPARED。
设备有多种不同的状态,SND_PCM_STATE_PREPARED 为其中一种,关于状态的问题,后面在向大家介绍。调用 snd_pcm_prepare()函数会使得 PCM 设备处于 SND_PCM_STATE_PREPARED 状态(也就是处于一种准备好的状态)。
使用示例:
ret = snd_pcm_hw_params(pcm_handle, hwparams); if (0 > ret) printf(stderr, "snd_pcm_hw_params error: %s\n", snd_strerror(ret));更多待补充。
读/写数据
接下来就可以进行读/写数据了,如果是 PCM 播放,则调用 snd_pcm_writei()函数向播放缓冲区 buffer中写入音频数据;如果是 PCM 录音,则调用 snd_pcm_readi()函数从录音缓冲区 buffer 中读取数据,它们的函数原型如下所示:
snd_pcm_sframes_t snd_pcm_writei(snd_pcm_t *pcm, const void *buffer, snd_pcm_uframes_t size ) snd_pcm_sframes_t snd_pcm_readi(snd_pcm_t *pcm, void *buffer, snd_pcm_uframes_t size )参数 pcm 为 PCM 设备的句柄;调用 snd_pcm_writei()函数,将参数 buffer(应用程序的缓冲区)缓冲区中的数据写入到驱动层的播放环形缓冲区 buffer 中,参数 size 指定写入数据的大小,以帧为单位;通常情况下,每次调用 snd_pcm_writei()写入一个周期数据。调用 snd_pcm_readi()函数,将从驱动层的录音环形缓冲区 buffer 中读取数据到参数 buffer 指定的缓冲区中(应用程序的缓冲区),参数size指定读取数据的大小,以帧为单位;通常情况下,每次调用snd_pcm_readi()读取一个周期数据。
Tips:snd_pcm_writei/snd_pcm_readi 函数原型中,参数 buffer 指的是应用程序的缓冲区,不要与驱动层的环形缓冲区搞混了!
snd_pcm_readi/snd_pcm_writei 调用成功,返回实际读取/写入的帧数;调用失败将返回一个负数错误码。即使调用成功,实际读取/写入的帧数不一定等于参数 size 所指定的帧数,仅当发生信号或 XRUN 时,返回的帧数可能会小于参数 size。
阻塞与非阻塞
调用 snd_pcm_open()打开设备时,若指定为阻塞方式,则调用 snd_pcm_readi/snd_pcm_writei 以阻塞方式进行读/写。对于 PCM 录音来说,当 buffer 缓冲区中无数据可读时,调用 snd_pcm_readi()函数将会阻塞,直到音频设备向 buffer 中写入采集到的音频数据;同理,对于 PCM 播放来说,当 buffer 缓冲区中的数据满时,调用 snd_pcm_writei()函数将会阻塞,直到音频设备从 buffer 中读走数据进行播放。若调用 snd_pcm_open()打开设备时,指定为非阻塞方式,则调用 snd_pcm_readi/snd_pcm_writei 以非阻塞方式进行读/写。对于 PCM 录音来说,当 buffer 缓冲区中无数据可读时,调用 snd_pcm_readi()不会阻塞、而是立即以错误形式返回;同理,对于 PCM 播放来说,当 buffer 缓冲区中的数据满时,调用 snd_pcm_writei()函数也不会阻塞、而是立即以错误形式返回。
snd_pcm_readn 和 snd_pcm_writen
snd_pcm_readi/snd_pcm_writei 适用于交错模式(interleaved)读/写数据,如果用户设置的访问类型并不是交错模式,而是非交错模式(non interleaved),此时便不可再使用 snd_pcm_readi/snd_pcm_writei 进行读写操作了,而需要使用 snd_pcm_readn 和 snd_pcm_writen 进行读写。
示例代码
示例代码之 PCM 播放
直接参考正点原子开发手册。
示例代码之 PCM 录音
直接参考正点原子开发手册。
使用异步方式
上小节中的示例代码 28.5.1 和示例代码 28.5.2 都是采用了同步方式进行读写,这样会使得应用程序无法做一些其它的事情,本小节我们来学习如何使用异步方式读写。
其实使用异步方式读写非常简单,只需要注册异步处理函数即可。
snd_async_add_pcm_handler()函数
alsa-lib 提供了 snd_async_add_pcm_handler()函数用于注册异步处理函数,其实我们只需要通过这个函数注册一个异步处理函数即可,其函数原型如下所示:
int snd_async_add_pcm_handler(snd_async_handler_t **handler, snd_pcm_t *pcm, snd_async_callback_t callback, void *private_data )调用该函数需要传入 4 个参数:
handler:参数 snd_async_handler_t 用于描述一个异步处理,所以一个 snd_async_handler_t 对象表示一个异步处理对象;调用snd_async_add_pcm_handler()函数会实例化一个snd_async_handler_t对象,并将对象的指针(指针作为异步处理对象的句柄)通过*handler 返回出来。
⚫ pcm:pcm 设备的句柄。
⚫ callback:异步处理函数(或者叫回调函数),snd_async_callback_t 函数指针如下所示:
typedef void(*snd_async_callback_t)(snd_async_handler_t *handler)参数 handler 也就是异步处理对象的句柄。
⚫ private_data:传递给异步处理函数的私有数据,私有数据的数据类型,可以由用户自己定义,调用 snd_async_add_pcm_handler()函数时,参数 private_date 指向你的私有数据对象。在异步处理函数中便可以获取到私有数据,调用 snd_async_handler_get_callback_private()函数即可,如下所示:
struct my_private_data *data = snd_async_handler_get_callback_private(handler);关于 snd_async_add_pcm_handler()函数的参数介绍,就给大家说这么多。当调用该函数之后,用户传入的 PCM 设备将会与异步处理对象关联起来,在异步处理函数 callback 中可以通过异步处理对象的句柄获取到 PCM 设备的句柄,通过 snd_async_handler_get_pcm()获取,如下所示:
snd_pcm_t *pcm_handle = snd_async_handler_get_pcm(handler);实现异步 I/O,应用程序通常需要完成这三件事情:
⚫ 使能异步 I/O;
⚫ 设置异步 I/O 的所有者;
⚫ 注册信号处理函数(譬如 SIGIO 信号或其它实时信号)。
这是内容在 13.3 小节给大家详细介绍过,这里不再啰嗦!所以由此可知,snd_async_add_pcm_handler函数中已经帮我们完成这些事情。
使用示例:
tatic void snd_playback_async_callback(snd_async_handler_t *handler) { snd_pcm_t *handle = snd_async_handler_get_pcm(handler);//获取 PCM 句柄 ...... } int main(void) { ...... snd_async_handler_t *async_handler = NULL; /* 注册异步处理函数 */ ret = snd_async_add_pcm_handler(&async_handler, pcm, snd_playback_async_callback, NULL); if (0 > ret) fprintf(stderr, "snd_async_add_pcm_handler error: %s\n", snd_strerror(ret)); ...... }调用 snd_async_add_pcm_handler()注册了异步回调函数 snd_playback_async_callback(),当环形缓冲区有空闲的周期可填充数据时(以播放为例),音频设备驱动程序会向应用程序发送信号(SIGIO),接着应用程序便会跳转到 snd_playback_async_callback()函数执行。
而对于录音来说,当环形缓冲区中有数据可读时(譬如音频设备已经录制了一个周期、并将数据写入到了环形缓冲区),驱动程序便会向应用程序发送信号,接着应用程序跳转到回调函数执行。
在播放情况下,通常我们会先将环形缓冲区填满,当音频设备每播放完一个周期,就会产生一个空闲周期,此时应用程序会接收到信号,进而跳转到异步回调函数中执行。
snd_pcm_avail_update()函数
在异步处理函数中,我们通常会使用到这个函数,在录音情况下,应用程序调用 snd_pcm_avail_update()函数用于获取当前可读取的帧数;在播放情况下,应用程序调用该函数用于获取当前可写入的帧数。换句话说,也就是驱动层环形缓冲区中当前有多少帧数据可读取(录音)或可写入多少帧数据(播放,环形缓冲区未满时、应用程序才可写入数据)。
该函数原型如下所示:
snd_pcm_sframes_t snd_pcm_avail_update(snd_pcm_t *pcm);本小节主要给大家介绍这两个函数,因为后面的示例代码中会使用到。
PCM 播放示例-异步方式
通过上面的介绍,本小节我们来编写一个使用异步方式的PCM播放示例程序,直接基于示例代码 28.5.1进行修改,代码笔者已经写好了,如下所示:
本 例 程 源 码 对 应 的 路 径 为 : 开 发 板 光 盘 ->11 、 Linux C 应 用 编 程 例 程 源 码 ->28_alsalib->pcm_playback_async.c。
直接参考正点原子开发手册在 snd_pcm_init() 函 数 中, 我 们 调 用了 snd_async_add_pcm_handler() 函数注册了异步回调函数 snd_playback_async_callback(),当可写入数据时,跳转到 snd_playback_async_callback()函数去执行。
在异步回调函数中,我们首先调用 snd_pcm_avail_update()获取当前可写入多少帧数据,然后在 while()循环中调用 read()读取音频文件的数据、接着调用 snd_pcm_writei()向环形缓冲区写入数据,每次循环写入一个周期,直到把缓冲区写满,然后退出回调函数。
回到 main()函数中,在进入 for()死循环之前,我们先将环形缓冲区填满,执行的代码与回调函数中的代码相同,这里就不再说明了!
编译示例代码
在 Ubuntu 系统下执行命令,编译示例代码:
${CC} -o testApp testApp.c -lasound
试应用程序
将上面编译得到的可执行文件拷贝开发板 Linux 系统/home/root 目录下,然后在开发板上测试,大家自己去测!
PCM 录音示例-异步方式
本小节编写使用异步方式的 PCM 录音的示例程序,代码笔者已经写好了,如下所示:
本 例 程 源 码 对 应 的 路 径 为 : 开 发 板 光 盘 ->11 、 Linux C 应 用 编 程 例 程 源 码 ->28_alsalib->pcm_capture_async.c。
份代码基于示例代码 28.5.2 改写,使用异步方式读取录制的音频数据。
直接参考正点原子开发手册代码不再解释了,值得注意的是,在 main()函数中我们调用了 snd_pcm_start()函数,这个函数前面没给大家介绍过,该函数的作用其实如它命名那般,用于启动 PCM 设备,譬如在录音情况下,调用该函数开始录音;在播放情况下,调用该函数开始播放。
前面的几个示例代码中,为啥没有调用该函数呢?这个问题我们先留着、稍后再给大家介绍!
编译示例代码
执行命令编译示例代码:
${CC} -o testApp testApp.c -lasound
测试应用程序
将编译得到的可执行文件拷贝到开发板 Linux 系统/home/root 目录下,然后进行测试,测试方法与示例代码 28.5.2 对应的测试程序相同,这里不再重述,大家自己去测!
使用 poll()函数
上小节我们使用了异步 I/O 方式读写 PCM 设备,本小节我们来学习如何使用 poll I/O 多路复用来实现读写数据。
使用 poll I/O 多路复用实现读写
I/O 多路复用是一种高级 I/O,在第一篇 13.2 小节给大家进行了详细地介绍,可通过 select()或 poll()函数来实现 I/O 多路复用,本小节我们使用 poll()函数来实现 I/O 多路复用,接下来将向大家介绍!
获取计数:snd_pcm_poll_descriptors_count
该函数用于获取 PCM 句柄的轮询描述符计数,其函数原型如下所示:
int snd_pcm_poll_descriptors_count(snd_pcm_t *pcm);调用该函数返回 PCM 句柄的轮询描述符计数。
分配 struct pollfd 对象
为每一个轮询描述符分配一个 struct pollfd 对象,譬如:
struct pollfd *pfds = NULL; int count; /* 获取 PCM 句柄的轮询描述符计数 */ count = snd_pcm_poll_descriptors_count(pcm); if (0 >= count) { fprintf(stderr, "Invalid poll descriptors count\n"); return -1; } /* 分配内存 */ pfds = calloc(count, sizeof(struct pollfd)); if (NULL == pfds) { perror("calloc error"); return -1; }填充 struct pollfd:snd_pcm_poll_descriptors
接下来调用 snd_pcm_poll_descriptors()函数对 struct pollfd 对象进行填充(初始化),其函数原型如下所示:
int snd_pcm_poll_descriptors( snd_pcm_t *pcm, struct pollfd *pfds, unsigned int space );参数 space 表示 pfds 数组中的元素个数。
/* 填充 pfds */ ret = snd_pcm_poll_descriptors(pcm, pfds, count); if (0 > ret) eturn -1;poll+snd_pcm_poll_descriptors_revents
一切准备完成之后,就可以调用 poll()函数来监视 PCM 设备是否有数据可读或可写,当有数据可读或可写时,poll()函数返回,此时我们可以调用 snd_pcm_poll_descriptors_revents()函数获取文件描述符中返回的事件类型,并与 poll 的 events 标志进行比较,以确定是否可读或可写,snd_pcm_poll_descriptors_revents()
函数原型如下所示:
nt snd_pcm_poll_descriptors_revents( snd_pcm_t *pcm, struct pollfd *pfds, unsigned int nfds, unsigned short *revents )参数 nfds 表示 pfds 数组中元素的个数,调用该函数获取文件描述符中返回的事件,通过参数 revents 返回出来;注意,不要直接读取 struct pollfd 对象中的 revents 成员变量,因为 snd_pcm_poll_descriptors_revents()函数会对 poll()系统调用返回的 revents 掩码进行“分解”以纠正语义(POLLIN = 读取,POLLOUT = 写入)。
使用示例:
for ( ; ; ) { ret = poll(pfds, count, -1);//调用 poll if (0 > ret) { perror("poll error"); return -1; } ret = snd_pcm_poll_descriptors_revents(pcm, pfds, count, &revents); if (0 > ret) return -1; if (revents & POLLERR) //发生 I/O 错误 return -1; if (revents & POLLIN) {//表示可读取数据 // 从 PCM 设备读取数据 } if (revents & POLLOUT) {//表示可写入数据 // 将数据写入 PCM 设备 } }PCM 播放示例代码
对示例代码 28.5.1 进行修改,使用 poll I/O 多路复用,示例代码如下所示:
本 例 程 源 码 对 应 的 路 径 为 : 开 发 板 光 盘 ->11 、 Linux C 应 用 编 程 例 程 源 码 ->28_alsalib->pcm_playback_poll.c。
直接参考正点原子开发手册PCM 录音示例代码
对示例代码 28.5.2 进行修改,使用 poll I/O 多路复用,示例代码如下所示:
本 例 程 源 码 对 应 的 路 径 为 : 开 发 板 光 盘 ->11 、 Linux C 应 用 编 程 例 程 源 码 ->28_alsalib->pcm_capture_poll.c。
直接参考正点原子开发手册
PCM 设备的状态
本小节向大家介绍 PCM 设备的状态有哪些,alsa-lib 提供了函数 snd_pcm_state()用于获取 PCM 设备当前的状态,其函数原型如下所示:
snd_pcm_state_t snd_pcm_state(snd_pcm_t *pcm);可以看到它的返回值是一个 snd_pcm_state_t 类型的变量,snd_pcm_state_t 其实是一个枚举类型,描述了 PCM 设备包含的所有状态,如下所示:
enum snd_pcm_state_t { SND_PCM_STATE_OPEN = 0, SND_PCM_STATE_SETUP, SND_PCM_STATE_PREPARED, SND_PCM_STATE_RUNNING, SND_PCM_STATE_XRUN, SND_PCM_STATE_DRAINING, SND_PCM_STATE_PAUSED, SND_PCM_STATE_SUSPENDED, SND_PCM_STATE_DISCONNECTED, SND_PCM_STATE_LAST = SND_PCM_STATE_DISCONNECTED, SND_PCM_STATE_PRIVATE1 = 1024 }SND_PCM_STATE_OPEN
该状态表示 PCM 设备处于打开状态,譬如当调用 snd_pcm_open()后,PCM 设备就处于该状态。
SND_PCM_STATE_SETUP
alsa-lib 文档中的解释为“Setup installed”!该状态表示设备已经初始化完成了,参数已经配置好了。
SND_PCM_STATE_PREPARED
该状态表示设备已经准备好了,可以开始了“Ready to start”!譬如可以开始播放了、可以开始录音了。
面提到了这个状态,当应用程序调用 snd_pcm_hw_params() 函数之后,设备就处于 SND_PCM_STATE_PREPARED 状态了。应用程序中,可以调用 snd_pcm_prepare()函数使设备处于
SND_PCM_STATE_PREPARED 状态,该函数原型如下所示:
int snd_pcm_prepare(snd_pcm_t *pcm);该行数调用成功返回 0,失败将返回一个负数错误码。
函数调用成功,PCM 设备将处于 SND_PCM_STATE_PREPARED 状态。事实上,应用程序调用时 snd_pcm_hw_params()时,函数内部会自动调用 snd_pcm_prepare(),所以为什么调用 snd_pcm_hw_params() 之后设备就已经处于 SND_PCM_STATE_PREPARED 状态了;调用 snd_pcm_hw_params()函数,其实应该发生了两种状态的转变为:首先由 SND_PCM_STATE_OPEN 变为 SND_PCM_STATE_SETUP 状态、再由 SND_PCM_STATE_SETUP 变为 SND_PCM_STATE_PREPARED 状态。
SND_PCM_STATE_RUNNING
该状态表示设备正在运行,譬如正在播放、正在录音。
上小节我们提到,应用程序可以调用 snd_pcm_start()函数以启动 PCM 设备,启动成功之后,设备开始播放或采集,此时设备处于 SND_PCM_STATE_RUNNING 状态。
此外,当设备处于 SND_PCM_STATE_PREPARED 状态时,应用程序调用 snd_pcm_readi/snd_pcm_writei进行读写数据时,这些函数内部会自动调用 snd_pcm_start()函数;譬如播放模式下,调用 snd_pcm_writei 写入数据后,会自动开启 PCM 设备进行播放,这里要注意,一定是在数据写入到环形缓冲区之后、才开启 PCM设备播放音频,因为一旦开启之后,环形缓冲区中必须要有至少一个周期的数据可供音频设备播放,否则将会发生欠载(underrun)、函数调用以错误形式返回;在录音模式下,调用 snd_pcm_readi()函数后,自动开启 PCM 进行音频采集。
所以这就是为什么示例代码 28.5.1、示例代码 28.5.2、示例代码 28.6.1 这几个示例中并没有调用 snd_pcm_start()函数的原因。
当设备处于运行状态时,应用程序可调用 snd_pcm_drop()或 snd_pcm_drain()函数使设备停止运行,譬如停止播放、停止音频采集;它们的函数原型如下所示:
int snd_pcm_drain(snd_pcm_t *pcm); int snd_pcm_drop(snd_pcm_t *pcm);函数调用成功返回 0;失败返回负值错误码。
这两个函数都可使设备停止运行,它们的区别如下:
⚫ snd_pcm_drop()函数将立即停止 PCM,丢弃挂起的帧;
⚫ snd_pcm_drain()函数并不会立即停止 PCM,而是处理完挂起的帧之后再停止 PCM;对于播放,会等待所有待播放的帧播放完毕(应该就是环形缓冲区中的待播放数据),然后停止 PCM;对于录音,停止 PCM 之前会检索残留帧。
当调用 snd_pcm_drop()或 snd_pcm_drain()停止 PCM 设备后,设备将回到 SND_PCM_STATE_SETUP 状态。
SND_PCM_STATE_XRUN
当发生 XRUN 时,设备会处于 SND_PCM_STATE_XRUN 状态,XRUN 前面给大家解释过了,这里不再重述!当处于 SND_PCM_STATE_XRUN 状态时,应用程序可以调用 snd_pcm_prepare()使设备恢复,使其回到 SND_PCM_STATE_PREPARED 状态。
SND_PCM_STATE_DRAINING
这个状态笔者没弄清楚,alsa-lib 文档中的解释为“Draining: running (playback) or stopped (capture)”。
SND_PCM_STATE_PAUSED
ause 就是暂停的意思,所以该状态表示设备处于暂停状态。譬如当设备正在运行时(也就是处于SND_PCM_STATE_RUNNING 状态),应用程序调用 snd_pcm_pause()函数可让设备暂停,其函数原型如下
所示:
int snd_pcm_pause(snd_pcm_t *pcm, int enable);函 数 snd_pcm_pause() 既 可 以 使 的 设 备 暂 停 、 同 样 也 可 使 其 恢 复 ( 从 暂 停 恢 复 运 行 , 即 SND_PCM_STATE_RUNNING--->SND_PCM_STATE_RUNNING),通过参数 enable 控制;当 enable 等于1,表示使设备暂停;enable 等于 0 表示使设备恢复运行。
snd_pcm_pause()函数调用成功返回 0;失败返回一个负值错误码。
这 里 有 个 问 题 需 要 注 意 , 并 不 是 所 有 的 音 频 设 备 硬 件 上 支 持 暂 停 的 功 能 , 可 以 通 过 snd_pcm_hw_params_can_pause()函数来判断设备是否支持暂停,其函数原型如下所示:
int snd_pcm_hw_params_can_pause(const snd_pcm_hw_params_t *params);函数返回 1 表示硬件支持暂停;返回 0 表示硬件不支持暂停。
SND_PCM_STATE_SUSPENDED
该状态表示硬件已经挂起 suspended,如果硬件发生了挂起,应用程序可以调用 snd_pcm_resume()函数从挂起中恢复,并确保不会丢失样本数据(精细恢复)。snd_pcm_resume()函数原型如下所示:
int snd_pcm_resume(snd_pcm_t *pcm);函数调用成功返回 0;失败返回一个负值错误码。
当然,并非所有硬件都支持此功能,可以调用 snd_pcm_hw_params_can_resume()函数判断硬件是否支持从挂起中恢复,其函数原型如下所示:
int snd_pcm_hw_params_can_resume(const snd_pcm_hw_params_t *params);函数调用返回 1 表示支持,返回 0 表示不支持。
SND_PCM_STATE_DISCONNECTED
该状态表示硬件已经断开连接。
状态之间的转换
通过上面的介绍,我们已经知道了 PCM 设备的几种不同的状态、以及它们的一个转换关系,为了能够加深大家的印象,笔者对其进行了整理,主要整理了 SND_PCM_STATE_OPEN、SND_PCM_STATE_SETUP、 SND_PCM_STATE_PREPARED 、 SND_PCM_STATE_RUNNING 、 SND_PCM_STATE_XRUN以 及 SND_PCM_STATE_PAUSED 这 6 种状态之间的转换关系,如下图所示:
笔者尽力了!这图画的还是有点乱,不过没关系,状态转换还是描述清楚了。其实这个状态之间的转换关系不难理解,哪种状态能转哪种状态、哪种状态不能转哪种状态,这个还是很容易理解的。这里笔者就不再多说了。
PCM 播放示例代码-加入状态控制
通过上面的介绍,我们已经知道了 PCM 设备不同状态之间转换,譬如播放音乐时,如何暂停、如何停止、又如何恢复。本小节我们来编写一个 PCM 播放程序,在示例代码 28.6.1 的基础上,加入对播放过程的控制,譬如用户按下空格键可以暂停播放、再次按下空格则恢复播放。
示例代码笔者已经写好,如下所示。
本 例 程 源 码 对 应 的 路 径 为 : 开 发 板 光 盘 ->11 、 Linux C 应 用 编 程 例 程 源 码 ->28_alsalib->pcm_playback_ctl.c
直接参考正点原子开发手册上述示例程序是在示例代码 28.6.1 基础上进行修改了,加入了用户控制单元,程序设定:
⚫ q:在终端按下 q 键退出应用程序;
⚫ 终端按下空格键暂停播放,再次按下恢复播放。
下面给大家简单地介绍下上述示例代码的设计,在 main()函数中,我们首先屏蔽了 SIGIO 信号,如下:
/* 屏蔽 SIGIO 信号 */ sigemptyset(&sset); sigaddset(&sset, SIGIO); sigprocmask(SIG_BLOCK, &sset, NULL);这主要是为了程序设计上的安全考虑,等把环形缓冲区填满数据之后,再取消 SIGIO 信号屏蔽。当然,你也可以不这样做。
接着打开用户传入的音频文件、初始化 PCM 播放设备、申请应用程序所需的缓冲区:
/* 打开 WAV 音频文件 */ if (open_wav_file(argv[1])) exit(EXIT_FAILURE); /* 初始化 PCM Playback 设备 */ if (snd_pcm_init()) goto err1; /* 申请读缓冲区 */ buf = malloc(buf_bytes); if (NULL == buf) { perror("malloc error"); goto err2; }接着对终端进行设置,将终端配置为非规范模式、取消回显,配置为非规范模式之后,用户输入的字符会直接被应用程序读取到,而无需按下回车键;取消回显,意味着用户输入的字符,在终端不会显示出来,这些内容在串口应用编程章节给大家详细介绍过,这里就不再啰嗦!
/* 终端配置 */ tcgetattr(STDIN_FILENO, &old_cfg); //获取终端<标准输入-标准输出构成了一套终端> memcpy(&new_cfg, &old_cfg, sizeof(struct termios));//备份 new_cfg.c_lflag &= ~ICANON; //将终端设置为非规范模式 new_cfg.c_lflag &= ~ECHO; //禁用回显 tcsetattr(STDIN_FILENO, TCSANOW, &new_cfg);//使配置生效接下来将数据写入环形缓冲区,开始播放。
取消 SIGIO 信号信号屏蔽。
最后进入 for()循环中,通过 getchar()读取用户输入的字符,用户输入 q 时退出程序,这里需要注意,退出程序时需要调用 tcsetattr()将终端配置参数恢复到之前的状态,否则你的终端将可能会出现下面这种情况:
这个时候你就只能重启了。
用户输入空格暂停或恢复,调用 snd_pcm_pause()实现暂停/恢复。
代码比较简单,笔者也就不再多说了!
编译示例代码
执行命令编译应用程序:
{CC} -o testApp testApp.c -lasound
测试应用程序
将编译得到的可执行文件拷贝到开发板 Linux 系统/home/root 目录下,并准备一个 WAV 音频文件,接着我们执行测试程序:
运行之后,开始播放音乐,此时我们可以通过空格键来暂停播放、再按空格键恢复播放,按 q 键退出程序,大家自己去测试。
Tips:本测试程序不能放在后台运行,一旦放入后台,程序将停止(不是终止、是暂停运行),因为这个程序在设计逻辑上就不符合放置在后台,因为程序中会读取用户从终端(标准输入)输入的字符,如果放入后台,那用户输入的字符就不可能被该程序所读取到,这是其一;其二,程序中修改了终端的配置。
snd_pcm_readi/snd_pcm_writei 错误处理
当 snd_pcm_readi/snd_pcm_writei 调用出错时,会返回一个小于 0(负值)的错误码,可调用 snd_strerror()函数获取对应的错误描述信息。前面的示例代码中我们并没有对 snd_pcm_readi/snd_pcm_writei 的错误返回做过多、细节的处理,而是简单地在出错之后退出。
事实上,当调用 snd_pcm_readi/snd_pcm_writei 出错时,可根据不同的情况作进一步的处理,在 alsa-lib文档中有介绍到,snd_pcm_readi/snd_pcm_writei 函数的不同错误返回值,表示不同的含义,如下所示:
nd_pcm_readi()函数与它相同。
当返回值等于-EBADFD,表示 PCM 设备的状态不对,因为执行 snd_pcm_readi/snd_pcm_writei 读取/写入数据需要 PCM 设备处于 SND_PCM_STATE_PREPARED 或 SND_PCM_STATE_RUNNING 状态,前面已经详细地给大家介绍了 PCM 设备的状态间转换问题。
当返回值等于-EPIPE,表示发生了 XRUN,此时可以怎么做呢?这个可以根据自己的实际需要进行处理,譬如调用 snd_pcm_drop()停止 PCM 设备,或者调用 snd_pcm_prepare()使设备恢复进入准备状态。
当返回值等于-ESTRPIPE,表示硬件发生了挂起,此时 PCM 设备处于 SND_PCM_STATE_SUSPENDED状态,譬如你可以调用 snd_pcm_resume()函数从挂起中精确恢复,如果硬件不支持,还可调用snd_pcm_prepare()函数使设备进入准备状态,或者执行其它的处理,根据应用需求的进行相应的处理。
以上给大家介绍了调用 snd_pcm_readi/snd_pcm_writei 函数出错时的一些情况以及可以采取的一些措施!
总结
本章我们学习了 Linux 下的音频应用编程,应用程序基于 alsa-lib 库实现播放、录音等功能,本章并没有做过多深入的学习,仅仅只是给大家介绍了 alsa-lib 库函数中一些基本的 API 接口,其中还有绝大部分的接口并没有给大家介绍,如果大家有兴趣,可以自己深入研究、学习!
魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。
更多推荐


















所有评论(0)