[HarmonyOS Next示例代码] 鸿蒙 - 基础语音服务-AI语音识别

本示例展示了使用hiai引擎框架提供的语音识别能力。本示例展示了对一段音频流转换成文字的能力展示。需要使用hiai引擎框架文本转语音接口@kit.CoreSpeechKit.d.ts.

xiaohai_09

1082人浏览 · 2024-08-20 22:47:07

xiaohai_09 · 2024-08-20 22:47:07 发布

鸿蒙 - 基础语音服务-AI语音识别源码下载地址

介绍

本示例展示了使用hiai引擎框架提供的语音识别能力。

本示例展示了对一段音频流转换成文字的能力展示。

需要使用hiai引擎框架文本转语音接口@kit.CoreSpeechKit.d.ts.

效果预览

桌面	主界面	播报

使用说明：

在手机的主屏幕，点击”asrDemo“，启动应用。
点击“CreateEngine”，进行能力初始化。
点击“startRecording”，开始识别。
点击“audioTotext”，写流进行识别，需开发者准备好音频流。若demo中采用从音频文件中读取的方式获取音频流，优先执行执行如下命令：hdc_std file send 001.pcm /data/app/el2/100/base/com.huawei.hms.asrdemo/haps/hiaiuser/files hdc_std shell chmod 777 /data/app/el2/100/base/com.huawei.hms.asrdemo/haps/hiaiuser/files/001.pcm将PCM格式的音频信息导入本demo的沙箱路径下。点击audioTotext按钮即可从音频文件中获取音频信息并写入。
点击“finish”等按钮对识别事件进行控制。
点击“queryLanguagesCallback/queryLanguagesPromise”，查询支持的语种和音色。

工程目录

├─entry/src/main/ets                         // 代码区
│  ├─entryability
│  │  └─EntryAbility.ets       
│  └─pages
│     ├─AsrConstants.ts                      // 常量类
│     ├─AudioCapturer.ts                     // 录音器实现1
│     ├─FileCapturer.ts                      // 录音器实现2
│     ├─ICapturerInterface.ts                // 录音器接口类
│     ├─Index.ets                            // 主界面
│     └─Util.ts                              // 工具类
├─entry/src/main/resources                   // 应用资源目录
└─screenshots                                // 截图

具体实现

本示例展示了在@kit.CoreSpeechKit.d.ts定义的API：

createEngine(createEngineParams: CreateEngineParams, callback: AsyncCallback): void;
createEngine(createEngineParams: CreateEngineParams): Promise;
setListener(listener: RecognizerListener): void;
queryLanguages(params: LanguageQuery, callback: AsyncCallback<Array>): void;
queryLanguages(params: LanguageQuery): Promise<Array>;
startListening(params: StartParams): void;
writeAudio(sessionId: string, audio: Uint8Array): void;
finish(sessionId: string): void;
cancel(sessionId: string): void;
shutdown(): void;

业务使用时，需要先进行import导入speechRecognizer。调用writeAudio等接口，传入想要识别的音频，得到识别结果，观察日志等。参考entry/src/main/ets/pages/index.ets.

依赖

不涉及。

魔乐社区

魔乐社区（Modelers.cn) 是一个中立、公益的人工智能社区，提供人工智能工具、模型、数据的托管、展示与应用协同服务，为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作，由全产业链共同建设、共同运营、共同享有，推动国产AI生态繁荣发展。

更多推荐

全家桶集齐！Qwen3.5四款小模型上线魔乐社区，附昇腾全套实践教程

魔乐社区

Pont - 搭建前后端之桥：高效、灵活的接口管理工具

Pont 是一款强大的数据服务层解决方案，它能够帮助开发者快速搭建前后端之间的桥梁，实现接口的高效管理和代码自动生成。无论是新手还是有经验的开发者，都能通过 Pont 轻松处理接口文档、生成类型安全的 API 代码，从而显著提升开发效率。[![Pont 工具标志](https://raw.gitcode.com/gh_mirrors/po/pont/raw/3f1b7d4bbba3fd2dda