✨ 功能概览
本教程将教你如何在 Windows 系统上本地安装 OpenAI 的 Whisper 模型,实现英文音频 → 中文文字的自动识别与翻译,无需联网使用在线 API,全程离线运行。
🧱 第一步:安装 Python 环境
- 访问官网下载安装:
🔗 https://www.python.org/downloads/ - 安装时务必勾选 ✅ Add Python to PATH
- 安装完成后,在命令提示符输入以下命令确认:
python --version
🧪 第二步:创建并激活虚拟环境(推荐)
打开命令提示符,输入:
python -m venv whisper-env
.\whisper-env\Scripts\activate
激活后命令提示符会出现 (whisper-env) 前缀。
🔧 第三步:安装 Whisper 模型(使用 GitHub 最新源码)
确保你可以访问 GitHub(如使用 VPN),然后执行:
pip install git+https://github.com/openai/whisper.git
如安装失败,可尝试使用加速代理:
pip install git+https://ghproxy.com/https://github.com/openai/whisper.git
🎵 第四步:准备音频文件
将你要识别的英文音频文件放在当前目录下,例如 b2.wav。
支持格式包括:.wav, .mp3, .m4a, .flac, .webm 等。
🧠 第五步:运行 Whisper 进行识别 + 翻译
whisper b2.wav --task translate --language English
这条命令会将英文语音自动翻译成中文,识别结果保存在同目录下,生成这些文件:
b2.txt(识别/翻译后的纯文本)b2.srt(字幕格式,带时间轴)b2.vtt(Web 字幕格式)
✅ 附加说明
- 若
whisper命令不可用,可改用:python -m whisper b2.wav --task translate --language English - 若未安装
ffmpeg,建议加装依赖:pip install ffmpeg-python