百川智能 × 昇腾AI|百川重磅发布Baichuan2大模型!已上线昇思开源社区
创始人
2025-06-30 20:51:57
0

【2023年9月6日,北京】今日,百川智能在北京召开大模型发布会,正式发布Baichuan2开源大模型,昇腾AI基础软硬件平台正式支持Baichuan2大模型,并在昇思MindSpore开源社区大模型平台上线Baichuan2-7B模型开放体验。

发布会现场,百川智能宣布正式开源微调后的Baichuan2-7B、Baichuan2-13B、Baichuan2-13B-Chat与其量化版本4bit,面向学术及商业市场提供大模型服务,并且均为免费可商用。

昇思MindSpore版本开源仓链接:

https://gitee.com/mindspore/mindformers/blob/dev/research/baichuan2/baichuan2.md

昇思MindSpore开源社区大模型平台:

https://xihe.mindspore.cn/modelzoo/baichuan2_7b_chat

文理兼备性能优异,全面领先 LLaMA 2

Baichuan2-7B-Base 和 Baichuan2-13B-Base,均基于2.6T⾼质量多语⾔数据进⾏训练,在保留了上一代开源模型良好的生成与创作能力,流畅的多轮对话能力以及部署⻔槛较低等众多特性的基础上,两个模型在数学、代码、安全、逻辑推理、语义理解等能⼒有显著提升。其中Baichuan2-13B-Base相比上⼀代13B模型,数学能力提升49%,代码能⼒提升46%,安全能力提升37%,逻辑推理能力提升25%,语义理解能力提升15%。

本次开源的两个模型在各⼤评测榜单上的表现优秀,在MMLU、CMMLU、GSM8K等几⼤权威评估基准中,以绝对优势领先LLaMA 2,相比其他同等参数量大模型,表现也十分亮眼,性能大幅度优于LLaMA 2等同尺寸模型竞品。

更值得一提的是,根据MMLU等多个权威英文评估基准评分 Baichuan2-7b以70亿的参数在英文主流任务上与130 亿参数量的LLaMA 2基本持平。

7B参数模型的Benchmark成绩

13B参数模型的Benchmark成绩

Baichuan2-7B和Baichuan2-13B不仅对学术研究完全开放,开发者也仅需邮件申请获得官方商用许可后,即可以免费商用。

Baichuan2大模型

Baichuan2大模型是由百川智能开发的一系列开源可商用的大规模预训练语言模型。包含了70亿、130亿、530亿参数的模型。百川智能⾃成⽴之初,就将通过开源⽅式助⼒中国⼤模型⽣态繁荣作为公司的重要发展⽅向。此次开源的两款Baichuan2⼤模型,得到了上下游企业的积极响应,华为等众多知名企业均参加了本次发布会并与百川智能达成了合作。

昇腾AI

昇腾 AI 是以昇腾 AI 基础软硬件平台为基础构建的人工智能计算产业。昇腾AI基础软硬件平台包括 Atlas 系列硬件及伙伴自有品牌硬件、异构计算架构 CANN、全场景AI框架昇思 MindSpore、昇腾应用使能 MindX、一站式开发平台 ModelArts 和统一工具链MindStudio 等。

相关内容

热门资讯

如何允许远程连接到MySQL数... [[277004]]【51CTO.com快译】默认情况下,MySQL服务器仅侦听来自localhos...
如何利用交换机和端口设置来管理... 在网络管理中,总是有些人让管理员头疼。下面我们就将介绍一下一个网管员利用交换机以及端口设置等来进行D...
施耐德电气数据中心整体解决方案... 近日,全球能效管理专家施耐德电气正式启动大型体验活动“能效中国行——2012卡车巡展”,作为该活动的...
Windows恶意软件20年“... 在Windows的早期年代,病毒游走于系统之间,偶尔删除文件(但被删除的文件几乎都是可恢复的),并弹...
20个非常棒的扁平设计免费资源 Apple设备的平面图标PSD免费平板UI 平板UI套件24平图标Freen平板UI套件PSD径向平...
德国电信门户网站可实时显示全球... 德国电信周三推出一个门户网站,直观地实时提供其安装在全球各地的传感器网络检测到的网络攻击状况。该网站...
着眼MAC地址,解救无法享受D... 在安装了DHCP服务器的局域网环境中,每一台工作站在上网之前,都要先从DHCP服务器那里享受到地址动...
为啥国人偏爱 Mybatis,... 关于 SQL 和 ORM 的争论,永远都不会终止,我也一直在思考这个问题。昨天又跟群里的小伙伴进行...