相信很多人已经用过豆包、千问的语音转文本功能了,但是某些人可能因为公司规定等无法使用在线服务解决这类问题。
Owl Meeting 是一款识别、存储等各项功能均运行在本地的语音转文本应用。
主要功能:
- 支持普通话,中文方言,英语,日语、韩语以及25种欧洲语言。
- 边录边识别,支持同时录制麦克风和系统声音。
- 识别各类音视频文件。内置工具可处理声道、音频提取等问题。
- 无需GPU,CPU模式下,处理30min音频仅需1min(i5-11400H)
- 说话人分离,支持为同段音频中的每个人指定不同模型进行识别,以提高准确率。
- 强大的文本编辑功能。
- 自定义词典。根据词典内容自动对识别文本进行处理。
- 支持批量删除、替换,并可同步更新词典。
- 点击识别的文本自动播放对应音频,边听边改。