💬 在 Windows 上使用 Whisper 实现英文语音自动翻译成中文(离线处理教程)

✨ 功能概览

本教程将教你如何在 Windows 系统上本地安装 OpenAI 的 Whisper 模型,实现英文音频 → 中文文字的自动识别与翻译,无需联网使用在线 API,全程离线运行。


🧱 第一步:安装 Python 环境

  1. 访问官网下载安装:
    🔗 https://www.python.org/downloads/
  2. 安装时务必勾选 ✅ Add Python to PATH
  3. 安装完成后,在命令提示符输入以下命令确认:
    python --version

🧪 第二步:创建并激活虚拟环境(推荐)

打开命令提示符,输入:

python -m venv whisper-env
.\whisper-env\Scripts\activate

激活后命令提示符会出现 (whisper-env) 前缀。


🔧 第三步:安装 Whisper 模型(使用 GitHub 最新源码)

确保你可以访问 GitHub(如使用 VPN),然后执行:

pip install git+https://github.com/openai/whisper.git

如安装失败,可尝试使用加速代理:

pip install git+https://ghproxy.com/https://github.com/openai/whisper.git

🎵 第四步:准备音频文件

将你要识别的英文音频文件放在当前目录下,例如 b2.wav
支持格式包括:.wav, .mp3, .m4a, .flac, .webm 等。


🧠 第五步:运行 Whisper 进行识别 + 翻译

whisper b2.wav --task translate --language English

这条命令会将英文语音自动翻译成中文,识别结果保存在同目录下,生成这些文件:

  • b2.txt(识别/翻译后的纯文本)
  • b2.srt(字幕格式,带时间轴)
  • b2.vtt(Web 字幕格式)

✅ 附加说明

  • whisper 命令不可用,可改用:python -m whisper b2.wav --task translate --language English
  • 若未安装 ffmpeg,建议加装依赖:pip install ffmpeg-python

发表评论