TIDIGITS数据集介绍，官网编号LDC93S10

对于TIDIGITS数据集中的语音识别任务，HTK（Hidden Markov Model Toolkit）是一个常用的工具包。HTK识别器需要一个用Standard Lattice Format (SLF)建立的词的网络，该网络描述了词与词之间的转移。可以使用Hparse命令来创建这个词的网络，而。TIDIGITS数据集主要包含11个孤立数字，分别为one、two、three、four、five

ldcdata

538人浏览 · 2024-05-13 15:46:07

ldcdata · 2024-05-13 15:46:07 发布

TIDIGITS数据集主要包含11个孤立数字，分别为one、two、three、four、five、six、seven、eight、nine、oh和zero。这个数据集通常用于语音识别和语音处理任务。

对于TIDIGITS数据集中的语音识别任务，HTK（Hidden Markov Model Toolkit）是一个常用的工具包。HTK识别器需要一个用Standard Lattice Format (SLF)建立的词的网络，该网络描述了词与词之间的转移。可以使用Hparse命令来创建这个词的网络，而digit.gram文件通常是手工编辑的。

获取方法：

方法1：注册LDC账号并加入组织获取数据，官网链接：LDC官网

方法2：关注公众号，回复TIDIGITSLDC语料小助手https://mp.weixin.qq.com/s/8GgZFh9XAr7FYwivQ_ajRg