当前位置：首页 > 人工智能 > 正文

百川智能发布Baichuan 2开源大模型语义理解能力提升15%

2023-09-06 22:45:25　来源：IT之家　

　　百川智能今日召开主题为“百川汇海，开源共赢”的大模型发布会，正式开源微调后的 Baichuan2-7B、Baichuan2-13B、Baichuan2-13B-Chat 与其 4bit 量化版本，并且均为免费可商用。

　　百川智能此次还开源了模型训练的 Check Point，并宣布将发布 Baichuan 2 技术报告，详细介绍 Baichuan 2 的训练细节。

　　据百川智能官方介绍，Baichuan2-7B-Base 和 Baichuan2-13B-Base，均基于 2.6 万亿高质量多语言数据进行训练，两个模型在数学、代码、安全、逻辑推理、语义理解等能力有显著提升。

　　其中 Baichuan2-13B-Base 相比上一代 13B 模型，数学能力提升 49%，代码能力提升 46%，安全能力提升 37%，逻辑推理能力提升 25%，语义理解能力提升 15%。

　　在 MMLU、CMMLU、GSM8K 等基准测试中，百川智能的两个模型都比 LLaMA 2 的分数要高一些，且在“中文通用”部分优势较大。

　　Baichuan2-7B 和 Baichuan2-13B 不仅对学术研究完全开放，开发者也仅需邮件申请获得官方商用许可后，即可以免费商用。腾讯云、阿里云、火山方舟、华为、联发科等企业均参加了本次发布会并与百川智能达成了合作。

原标题：百川智能发布 Baichuan 2 开源大模型，号称“全面领先 LLaMA 2”

免责声明： 激光网遵守行业规则，本站所转载的稿件都标注作者和来源。激光网原创文章，请转载时务必注明文章作者和来源“激光网”，不尊重本站原创的行为将受到激光网的追责，转载稿件或作者投稿可能会经编辑修改或者补充，如有异议可投诉至：Email：133 467 34 45@qq.com

百川智能发布Baichuan 2开源大模型 语义理解能力提升15%