公开的语音文本情感数据集(附下载链接)
##语音情感数据集1、SWEA , 2017年发布, 这个数据集是AVEC情感竞赛2017~2019的数据集, 总时长44h, 自发性情感数据集(即录音的时候不指定情感,由录音人自由发挥)各种语言都有数据集介绍参考文献官网下载网址2、RECOLA2013, 这个数据集是AVEC情感竞赛2015、2016的数据集9.5h(有参考文献说是240min,可能是240分钟有标注)自发性情感数据集 法语数据
语音情感数据集
1、SWEA , 2017年发布, 这个数据集是AVEC情感竞赛2017~2019的数据集 , 总时长44h, 自发性情感数据集(即录音的时候不指定情感,由录音人自由发挥)各种语言都有
数据集介绍参考文献
官网下载网址
2、RECOLA 2013, 这个数据集是AVEC情感竞赛2015、2016的数据集 9.5h(有参考文献说是240min,可能是240分钟有标注) 自发性情感数据集 法语
数据集介绍参考文献
3、IEMOCAP 2008, 10039句, 表演数据集 英语
4、Emo-DB 2005, 406句(这个是某篇引用它的参考文献里写的,似乎官网上说500+) 表演数据集 德语
5、CHEAVD 2.0 , 2017, 中国科学院自动化研究所 7030 句 自然数据集, 中文
推荐的两种获取数据集方式, 联系论文作者填写数据集下载申请表(科研用途应该是免费的)或者参加MEC竞赛(已经很久没有举办了)
6、CASIA汉语情感语料库 , 2005, 中国科学院自动化研究所 9600句 表演数据集, 中文
这个数据集下载是收费的
其它没有公开数据集的一些文献
1、上交的一篇文章提到了1500句表演数据集
2、 重音数据集
文本情感数据集
1、NLPCC 2013 竞赛数据集,中文
这个数据集整理完是有4万多句,情感是八分类,['Other', 'Like', 'Sadness', 'Disgust', 'Anger', 'Happiness', 'Fear', 'Surprise’],这些是全人工标注的。
2、 情感对话数据集, 中文
这批数据也是来自微博,但是不是人工标注的,是根据NLPCC2013那个数据集训练的模型,预测的标签。情感是6分类['Other', 'Like', 'Sadness', 'Disgust', 'Anger', 'Happiness’】

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。
更多推荐
所有评论(0)