Buzz是一款开源的实时语音转文字工具,基于 OpenAI Whisper 的开源音频转文字模型。它支持 Windows、macOS 和 Linux 操作系统,并提供以下功能:实时语音转文字、离线音频转录和翻译,以及将视频和音频文件转换为文字和字幕等。
- 导入音频和视频文件,并将转录导出为 CSV、SRT、TXT 和 VTT 格式。
- 支持通过计算机麦克风进行实时语音转录和翻译(请注意,使用 Whisper 进行音频转录可能会消耗较多的系统资源,转录的实时性取决于系统资源和所选的语言和模型大小)。
- 支持超过90种语言的音频转录,包括从 X 语言到英文文本和从 X 语言到 X 语言的转录。
- 支持 Whisper、Whisper.cpp、Faster Whisper、Whisper 兼容的 Hugging FaCE 模型以及 OpenAI Whisper API。
- 提供命令行界面。
- 可在 Mac、Windows 和 Linux 系统上使用。
1. 下载和安装:从 Buzz 的官方网站或开源代码仓库下载适用于您操作系统的版本,并按照安装说明进行安装。
2. 配置语音输入:连接麦克风,确保系统正确识别麦克风设备。
3. 启动 Buzz:打开 Buzz 应用程序或在终端中运行 Buzz 命令。
4. 选择输入方式:根据需求选择实时语音输入或导入音频、视频文件。
5. 开始转换:根据界面提示或命令行参数设置,开始进行语音转文字操作。
6. 导出结果:转换完成后,将结果导出为文本文件、字幕文件或其他合适的格式。