跳到内容

夜深了,注意休息,愿你今夜好梦。

TigerBot

TigerBot

TigerBot是多语言大语言模型,其7B版本性能达同类模型96%。项目开源模型、代码与数据,包括100G预训练与1G微调数据,提供API支持快速定制。在BLOOM基础上优化了算法与中文处理,适用于金融、法律等专业领域开发。

浏览 502 收藏 0 外链点击 0 更新 2026年4月15日
适用地区
全球
适用平台
以官网说明为准
是否免费
以官网与标签为准

TigerBot是什么

TigerBot是一个能处理多种语言和任务的大规模语言模型。根据公开评测,TigerBot-7B这个版本的表现,达到了OpenAI同规模模型综合性能的96%。这还只是他们的第一个公开版本。

这次开源了哪些内容

他们把一系列探索成果都开放了出来:

  • 模型: 包括TigerBot-7B、TigerBot-7B基础版,以及用于研究的TigerBot-180B版本。
  • 代码: 提供了基本的训练和推理代码。甚至包含用两张显卡就能推理180B大模型的量化和推理方案。
  • 数据: 开源了100G的预训练数据,这些是从2TB原始数据里清洗、去噪、去重后得到的精华。还有1G(约100万条)的监督微调数据,覆盖了用户指令中常见的10个大类、120个小类任务。
  • API: 提供了聊天、插件、微调等接口,目标是让用户不用写代码,在半小时内就能训练和使用属于自己的大模型。
  • 领域数据: 特别包含了金融、法律、百科等领域的资料,邀请开发者一起打造专业级的应用。

在技术上做了哪些优化

团队在BLOOM模型的基础上,从架构到算法都进行了改进:

  • 创新了指令微调算法,让模型更容易学习和掌握新任务。
  • 采用集成与概率建模方法,让模型生成的内容在事实准确性和创造性之间更可控。
  • 突破了主流训练框架在内存和通信上的瓶颈,实现了在数千张显卡上连续数月的稳定训练。
  • 针对中文语言不规则的特性,从分词器到训练算法都做了专门的优化,让它更懂中文。

发表评论

正文
强调色