TIDIGITS数据集主要包含11个孤立数字,分别为one、two、three、four、five、six、seven、eight、nine、oh和zero。这个数据集通常用于语音识别和语音处理任务。

在数据准备阶段,需要建立任务语法,例如使用类似$digit= ( one | two | three | four | five |six | seven | eight | nine | zero | oh ); ([sil] <$digit sp> [sil])的语法描述。在这个语法中,|表示可选择的选项,尖括号< >表示一次或多次重复,中括号[ ]表示可选择的内容。

对于TIDIGITS数据集中的语音识别任务,HTK(Hidden Markov Model Toolkit)是一个常用的工具包。HTK识别器需要一个用Standard Lattice Format (SLF)建立的词的网络,该网络描述了词与词之间的转移。可以使用Hparse命令来创建这个词的网络,而digit.gram文件通常是手工编辑的。

 获取方法:

方法1:注册LDC账号并加入组织获取数据,官网链接:LDC官网

方法2:关注公众号,回复TIDIGITSLDC语料小助手icon-default.png?t=N7T8https://mp.weixin.qq.com/s/8GgZFh9XAr7FYwivQ_ajRg

Logo

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。

更多推荐