做的项目需要提一些音频特征,而librosa这个库非常给力,这里写一些介绍。

%E6%8D%95%E8%8E%B7-1.png

Youtube上有一个介绍的视频,台上这位大佬非常帅呀,想想他也是librosa team member,我会更喜欢librosa的。

下面根据文档简单的介绍下librosa的安装、功能等等。

每天做一点吧,希望期末的时候能完成。

一、安装

1. Windows: pip install librosa

2. Linux: sudo pip install librosa

也有对应ffmpeg的接口

二、 主要的IO和信号处理功能

2.1 音频处理

[table id=1 /]

2.1 频谱表示

stft(y[, n_fft, hop_length, win_length, …]) 短时傅里叶变化 (STFT)

istft(stft_matrix[, hop_length, win_length, …]) 逆短时傅里叶变化 (ISTFT).

ifgram(y[, sr, n_fft, hop_length, …]) 计算瞬时频率(按照采样率的比例)来获得复杂的频谱的时间倒数

cqt(y[, sr, hop_length, fmin, n_bins, …]) 计算音频信号的常量Q变换

hybrid_cqt(y[, sr, hop_length, fmin, …]) 计算音频信号的混合常量Q变换

pseudo_cqt(y[, sr, hop_length, fmin, …]) 计算伪常量Q变换

fmt(y[, t_min, n_fmt, kind, beta, …]) The fast Mellin transform (FMT) [R5] of a uniformly sampled signal y.

interp_harmonics(x, freqs, h_range[, kind, …]) 计算均匀采样下的快速梅林变换 (FMT)

salience(S, freqs, h_range[, weights, …]) 谐波特征函数

phase_vocoder(D, rate[, hop_length]) 相位编码器

magphase(D) 将一个复制的频谱图D分离成它的幅值S和相位D分量,D=S*P

Be the First to comment.

Logo

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。

更多推荐