声纹识别开源工具ASV-Subtools

厦门大学智能语音实验室

2020.11

纲 要

1. 背景介绍

2. 开源工具ASV -Subtools

3. 算法改进

4. 实验结果

5. 总结与展望

1. 背景介绍—声纹识别框架

FBank MFCC PLP

注册语音 声学特征 说话人表征 分

声纹模型 后端判别

测试语音 声学特征 说话人表征 数

GMM/i-vector NNET/x-vector

声纹识别框架图

1. 背景介绍—声纹识别技术

Softmax

损失 A -Softmax

AM-Softmax

函数 AAM-Softmax

……

TDNN

E-TDNN

F-TDNN

Resnet

加噪 CNN, SincNet

模拟远场

Specaug 数据 声纹识别 模型 Attention Pooling

Online扩增 LDE Pooling

Logo

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。

更多推荐