android 声纹识别 开源,声纹识别开源工具ASV-Subtools.pdf
声纹识别开源工具ASV-Subtools厦门大学智能语音实验室2020.11纲 要1. 背景介绍2. 开源工具ASV -Subtools3. 算法改进4. 实验结果5. 总结与展望1. 背景介绍—声纹识别框架FBankMFCCPLP注册语音声学特征说话人表征分声纹...
·
声纹识别开源工具ASV-Subtools
厦门大学智能语音实验室
2020.11
纲 要
1. 背景介绍
2. 开源工具ASV -Subtools
3. 算法改进
4. 实验结果
5. 总结与展望
1. 背景介绍—声纹识别框架
FBank MFCC PLP
注册语音 声学特征 说话人表征 分
声纹模型 后端判别
测试语音 声学特征 说话人表征 数
GMM/i-vector NNET/x-vector
声纹识别框架图
1. 背景介绍—声纹识别技术
Softmax
损失 A -Softmax
AM-Softmax
函数 AAM-Softmax
……
TDNN
E-TDNN
F-TDNN
Resnet
加噪 CNN, SincNet
模拟远场
Specaug 数据 声纹识别 模型 Attention Pooling
Online扩增 LDE Pooling
魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。
更多推荐



所有评论(0)