山中砾

山中砾

通过Ollama接入沉浸式翻译并配置WiNGPT-Babel模型

2025-04-12

WiNGPT-Babel介绍

1. 模型简介

WiNGPT-Babel(巴别塔)是由 Winning Health 开发的一款专为翻译应用定制的大语言模型(LLM)。该模型致力于提供便捷的多语言信息母语级体验,其最大特点是采用了 human-in-the-loop 数据生产采集闭环策略进行训练。这使得 WiNGPT-Babel 更适应真实使用场景,如新闻、研究成果以及带有实时翻译字幕的视频内容。

与传统机器翻译模型不同,WiNGPT-Babel 的目标是利用先进的 LLM 技术降低语言障碍,帮助用户更轻松地获取全球范围内的互联网信息,包括学术论文、社交媒体、网页内容和视频字幕等各种数据格式。

2. 核心特点

2.1 Human-in-the-loop 训练方法

  • 首先使用少量数据进行初步训练

  • 通过 API 收集使用各种工具的日志数据,并利用这些日志构建新的训练数据

  • 使用 WiNGPT-2.6 模型和奖励模型对数据进行 rejection sampling

  • 辅以人工审核确保数据质量

  • 经过多轮迭代训练,直至模型性能达到预期水平

2.2 多样化功能

  • 多格式翻译:支持网页、社交媒体内容、学术论文、视频字幕及数据集等多种文本格式

  • 高精度翻译:基于先进的 LLM 架构,提供准确、自然、流畅的翻译结果

  • 高性能翻译:采用 1.5B 参数规模模型,支持实时字幕翻译等应用场景

  • 多语言支持:目前支持超过 20 种语言,并不断扩展

  • 应用适配:已适配沉浸式翻译、videolingo 等工具

3. 适用场景

WiNGPT-Babel 模型适用于多种翻译场景:

  • 网页内容翻译:日常网页浏览,快速理解网页信息

  • 学术论文翻译:辅助理解多语言研究论文,提高阅读效率

  • 新闻资讯翻译:快速了解全球新闻动态,获取一手信息

  • 视频字幕翻译:观看外语视频,辅助理解视频内容

  • 数据集多语言处理:多语言数据集的初步翻译,辅助数据分析

4. 语言支持

目前已确认支持的语言包括:

  • 英文 ↔️ 中文

  • 日文 ➡️ 中文

更多语言支持正在验证中。

如何使用

注:如果没有安装Ollama请先安装Ollama,如何安装:windows下如何通过Ollama部署本地大模型

1. 首先拉取WiNGPT-Babel模型

  ollama pull hf.co/winninghealth/WiNGPT-Babel:Q8_0

2. 安装并配置沉浸式翻译扩展

2.1 根据你的浏览器安装沉浸式翻译扩展:

   Chrome 商店

   Firefox 附加组件

   Edge 插件商店

2.2 进行翻译服务的配置

   安装完成后,点击浏览器工具栏中的沉浸式翻译图标

   进入设置 → 翻译服务

   在翻译服务列表中找到并选择"添加 OpenAI 兼容服务"

   配置 Ollama 服务:

   服务地址:http://localhost:11434(如果你修改了 Ollama 的默认端口,请相应调整)

   模型名称:hf.co/winninghealth/WiNGPT-Babel:Q8_0

   APIKEY:未设置可留空

   翻译策略改为通用可自定义提示词:WiNGPT-Babel已内置提示词,留空效果最好

  点击"测试连接"确认配置正确(配置会自动保存设置)

  在设置 → 翻译服务翻译服务中将该服务设为默认

至此便可以通过悬浮球等方式进行网页翻译