Skip to content

使用 Windows 11 的 Live Captions 语音识别文本功能,再通过大语言模型API,实现英文语音字幕的实时翻译,并以中文浮窗形式显示。

Notifications You must be signed in to change notification settings

mingxing0769/Livecaptions_translator

Repository files navigation

实时同声传译工具 (Real-time Simultaneous Interpretation Tool)

Python PyQt5 License

本项目是一个运行于 Windows 平台的桌面应用程序,旨在提供实时的同声传译功能。它能够捕捉系统内置“实时辅助字幕”功能所转录的英文文本,将其发送至一个大型语言模型(LLM)进行翻译,并将翻译结果显示在一个可自定义的、置顶的字幕窗口中。

项目截图

项目截图


▶️ 使用方法

  1. 从Releases 下载 default.zip 压缩包 解压到任意目录
  2. 确保你的语言模型服务正在运行
  3. 运行主程序: 实时语音.exe
  4. 程序会启动“参数设置”窗口,设置正常的API参数后,点击 开始翻译
  5. 一个半透明的字幕窗口会出现在屏幕上,显示实时翻译结果
  6. 你可以在设置窗口中/或打开config.ini 修改参数.

本地LLM API服务:

使用llama-server、Ollama 或 LM Studio都可以。

模型建议 :

ERNIE-4.5-21B-A3B-PT-UD-Q3_K_XL.gguf

Qwen3-VL-30B-A3B-Instruct-UD-Q3_K_XL.gguf

低配置电脑 可以用2bit量化版 效果都差不多。


特别说明:

本项目,原本个人爱好和需要完成部分,后来大部分由AI补充改写,个人使用也因水平有限.代码可能存在问题.

📄 许可证

本项目采用 MIT License 授权。

About

使用 Windows 11 的 Live Captions 语音识别文本功能,再通过大语言模型API,实现英文语音字幕的实时翻译,并以中文浮窗形式显示。

Topics

Resources

Stars

Watchers

Forks

Packages

 
 
 

Contributors

Languages