音频特征----频谱图
频谱图是音频的一个重要特征,在深度学习算法中也经常用到,是通过视觉表示频谱的频率、声音或其他信号,因为它们随时间变化。频谱图有时被称为超声波仪,声纹或语音图。二维矩阵中一般第一维是频率,第二维是时间。而在频谱图中,横轴表示时间,纵轴表示频率。闲言少叙,直接上代码:利用librosa显示音频频谱图的源代码:import librosaimport matplotlib.pyplot as pltim
·
频谱图是音频的一个重要特征,在深度学习算法中也经常用到,是通过视觉表示频谱的频率、声音或其他信号,因为它们随时间变化。频谱图有时被称为超声波仪,声纹或语音图。二维矩阵中一般第一维是频率,第二维是时间。而在频谱图中,横轴表示时间,纵轴表示频率。闲言少叙,直接上代码:
利用librosa显示音频频谱图的源代码:
import librosa
import matplotlib.pyplot as plt
import librosa.display
audioFile='test.wav'
x,sr=librosa.load(audioFile)
X=librosa.stft(x)
Xdb=librosa.amplitude_to_db(abs(X))
plt.figure(figsize=(18,5))
librosa.display.specshow(Xdb,sr=sr,x_axis='time',y_axis='hz')
plt.colorbar()
plt.show()
展示效果图如下:
推荐一个公众号:健哥聊量化,会持续推出股票相关基础知识,以及python实现的一些基本的分析代码。欢迎大家关注,二维码如下:

相关文章列表如下:
魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。
更多推荐



所有评论(0)