APUS大模型3.0的首个开源大模型正式亮相
创始人
2025-07-12 13:30:37
0


近日,APUS与深圳大学大数据系统计算技术国家工程实验室(以下简称“大数据国家工程实验室”)联合训练伶荔Linly-70B中文大模型,并在GitHub上正式首发开源,这是APUS大模型3.0的首个开源大模型。


图片1.jpg.png图片1.jpg.png

 

据了解,APUS大模型3.0伶荔在中文基准测评榜单C-Eval上评分80.6分,中文能力超越GPT-4,在所有参评模型中排名第三,相比原始开源模型标杆LLaMa2-70B取得了大幅提升。

图片2.png图片2.png

 

值得注意的是,大数据国家工程实验室由深圳大学牵头,与国家信息中心、清华大学和腾讯科技等联合建设;更有中国科学院陈国良院士、国家重点研发项目首席科学家李坚强等一批拔尖人才组成研发组,实验室副主任沈琳琳教授领导的伶荔项目团队支撑了此次模型的联合训练和开源发布。

 

此次APUS与大数据国家工程实验室联合训练开源的APUS大模型3.0伶荔中文大模型,进一步推动了AI技术创新与国内场景应用深化融合。“伶荔是国内仅有的几家700亿参数规模的中文开源大模型之一,相信能让更多国人开发者参与到人工智能产业大潮中。”伶荔项目团队李煜东博士如此表示。

 

可以看到,APUS大模型3.0伶荔中文大模型在词表大小、训练语料等方面进行了定制化调优,基于模块化增量预训练框架开发,针对中文场景扩充词表,增加汉字和中文符号支持,实现综合性能达到同量级开源模型的领先水平。在语料训练上,APUS大模型3.0伶荔采用高质量中英文公开数据源包括悟道、万卷、MNBVC等,并结合自研数据选择策略,构成模型高效训练的混合语料库。基于APUS郑州智算中心的算力支持,APUS大模型3.0伶荔耗时3个月完成训练,当前上下文长度设定为4K(约8000-10000汉字)。

 

此外,伶荔项目团队还提出课程学习策略,基于动态数据采样,在训练中调整数据的分布,实现将模型的英文语言能力平稳迁移学习到中文能力领域,为训练出高性能中文大模型提供有力保障。

 

随着APUS大模型3.0伶荔的联合发布、开源,国产开源大模型向构建中文场景大型语言模型又迈出了重要一步。此次合作也是双方深化践行“为中国定制人工智能大模型,积极构建人工智能生态,让大模型应用和价值创造接轨”战略的重要举措。

 

据悉,APUS还将与大数据国家工程实验室持续推动模型的能力提升和应用拓展,积极探索深化大模型在工具使用、剧情生成和角色扮演、医疗等领域的专业能力,聚力构建大模型生态,让为中国打造的AI大模型真正驱动中国AI产业高质量发展,实现价值共创,赋能千行万业。



相关内容

热门资讯

如何允许远程连接到MySQL数... [[277004]]【51CTO.com快译】默认情况下,MySQL服务器仅侦听来自localhos...
如何利用交换机和端口设置来管理... 在网络管理中,总是有些人让管理员头疼。下面我们就将介绍一下一个网管员利用交换机以及端口设置等来进行D...
施耐德电气数据中心整体解决方案... 近日,全球能效管理专家施耐德电气正式启动大型体验活动“能效中国行——2012卡车巡展”,作为该活动的...
Windows恶意软件20年“... 在Windows的早期年代,病毒游走于系统之间,偶尔删除文件(但被删除的文件几乎都是可恢复的),并弹...
20个非常棒的扁平设计免费资源 Apple设备的平面图标PSD免费平板UI 平板UI套件24平图标Freen平板UI套件PSD径向平...
德国电信门户网站可实时显示全球... 德国电信周三推出一个门户网站,直观地实时提供其安装在全球各地的传感器网络检测到的网络攻击状况。该网站...
着眼MAC地址,解救无法享受D... 在安装了DHCP服务器的局域网环境中,每一台工作站在上网之前,都要先从DHCP服务器那里享受到地址动...
为啥国人偏爱 Mybatis,... 关于 SQL 和 ORM 的争论,永远都不会终止,我也一直在思考这个问题。昨天又跟群里的小伙伴进行...