语音转文字增强工具,支持离线语音识别和 AI 文本优化。
- 离线语音识别 (Whisper)
- AI 文本增强 (Qwen)
- 中英互译
- 降噪处理
- 智能缓存
- 剪贴板集成
- Python 3.8+
- FFmpeg
- Ollama
# 安装 FFmpeg
brew install ffmpeg # macOS
apt install ffmpeg # Ubuntu/Debian
choco install ffmpeg # Windows
# 安装依赖
pip install -r requirements.txt
# 安装 Qwen 模型
ollama pull qwen2.5:32b
# 单次识别
python -m src.main
# 后台监听模式(使用唤醒词"小王小王")
python -m src.main -b
# 持续监听模式
python -m src.main -c
WhisperPen/
├── src/ # 源代码
├── tests/ # 测试代码
├── config/ # 配置文件
├── data/ # 数据文件
└── docs/ # 文档
- Name: Zorro
- Email: [email protected]
- Github: @zuozuo
MIT License