当前位置：首页 > 人工智能 > 正文

书生・浦语20B开源AI大模型发布：支持数十类插件上万个API功能

2023-09-21 14:13:19　来源：IT之家　

　　今年 6 月，上海 AI 实验室发布了“书生・浦语”(InternLM)大模型，为 104B 参数，后续又推出了 7B 和 13B 规格模型。

　　近日，上海 AI 实验室、商汤科技、香港中文大学、复旦大学宣布推出书生・浦语 20B 版本，这是一款中量级大模型，号称基于 2.3T Tokens 预训练语料从头训练，相较于 InternLM-7B，其理解能力、推理能力、数学能力、编程能力等都有显著提升。

　　据介绍，相比于此前国内陆续开源的 7B 和 13B 规格模型，20B 量级模型具备更强大的综合能力，复杂推理和反思能力尤为突出，能为实际应用场景提供更有力的性能支持;同时，20B 量级模型可在单卡上进行推理，经过低比特量化后，可运行在单块消费级 GPU 上，因而在实际应用中更为便捷。

　　相比于此前的开源模型，InternLM-20B 拥有几大亮点，汇总如下：

　　以不足 1/3 的参数量，测评成绩达到了 Llama2-70B 的水平。

　　支持数十类插件，上万个 API 功能，还具备代码解释和反思修正能力。

　　实现了对长文理解、长文生成和超长对话的有效支持，同时支持 16K 语境长度。

　　研究团队进行了基于 SFT 和 RLHF 两阶段价值对齐，并通过专家红队的对抗训练大幅提高其安全性。

　　此外，书生・浦语开源工具链也已全新升级，形成更完善的体系，包括预训练框架 InternLM-Train、低成本微调框架 XTuner、部署推理框架 LMDeploy、评测框架 OpenCompass 以及面向场景应用的智能体框架 Lagent。

原标题：书生・浦语 20B 开源 AI 大模型发布，消费级 GPU 单卡即可运行

免责声明： 激光网遵守行业规则，本站所转载的稿件都标注作者和来源。激光网原创文章，请转载时务必注明文章作者和来源“激光网”，不尊重本站原创的行为将受到激光网的追责，转载稿件或作者投稿可能会经编辑修改或者补充，如有异议可投诉至：Email：133 467 34 45@qq.com

榜单