语音情感数据集

1、SWEA , 2017年发布, 这个数据集是AVEC情感竞赛2017~2019的数据集 , 总时长44h,  自发性情感数据集(即录音的时候不指定情感,由录音人自由发挥)各种语言都有

数据集介绍参考文献

官网下载网址

 

2、RECOLA    2013, 这个数据集是AVEC情感竞赛2015、2016的数据集    9.5h(有参考文献说是240min,可能是240分钟有标注)    自发性情感数据集  法语

数据集介绍参考文献

官网下载网址


3、IEMOCAP    2008,  10039句,    表演数据集  英语

数据集介绍参考文献

官网下载网址


4、Emo-DB    2005, 406句(这个是某篇引用它的参考文献里写的,似乎官网上说500+)    表演数据集  德语

柏林情感数据集参考文献

官方下载网址


5、CHEAVD 2.0 , 2017,   中国科学院自动化研究所    7030 句   自然数据集, 中文

1.0版本数据库介绍

2.0版本数据库介绍

推荐的两种获取数据集方式, 联系论文作者填写数据集下载申请表(科研用途应该是免费的)或者参加MEC竞赛(已经很久没有举办了)


6、CASIA汉语情感语料库 , 2005,   中国科学院自动化研究所    9600句    表演数据集, 中文

这个数据集下载是收费的

数据集下载链接

 

 

其它没有公开数据集的一些文献

1、上交的一篇文章提到了1500句表演数据集

参考文献

2、 重音数据集

966句日英混合重音数据集

2530句日英混合重音数据集

 

文本情感数据集

1、NLPCC 2013 竞赛数据集,中文

这个数据集整理完是有4万多句,情感是八分类,['Other', 'Like', 'Sadness', 'Disgust', 'Anger', 'Happiness', 'Fear', 'Surprise’],这些是全人工标注的。

下载链接

 

2、 情感对话数据集, 中文

这批数据也是来自微博,但是不是人工标注的,是根据NLPCC2013那个数据集训练的模型,预测的标签。情感是6分类['Other', 'Like', 'Sadness', 'Disgust', 'Anger', 'Happiness’

下载链接

 

Logo

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。

更多推荐