快手自研大模型「快意」亮相 在多个大模型榜单上表现优异
创始人
2025-06-29 13:41:06
0

据报道,快手正式加入大模型赛道,其自研大模型「快意」(KwaiYii)已经开启内测,并为业务团队提供了标准API和定制化项目合作方案。目前,「快意」在多个知名大模型排行榜上表现强劲,在CMMLU中文向排名第一,引发了广泛关注。

KwaiYii-13B在CMMLU中文向排名第一

根据其GitHub主页介绍,「快意」是由快手AI团队从零到一独立自研的大规模语言模型,而本次引发关注的正是其新版本KwaiYii-13B。该模型在多个Benchmark上都处于领先水平,证明了其在自然语言处理任务中的出色性能。

其中,KwaiYi-13B-Base预训练模型具备优异的通用技术底座能力,在MMLU、CMMLU、C-Eval、HumanEval等Benchmark上目前处于同等模型规模的领先水平,显示了快意大模型在中文和英文上都具备非常强悍的能力。


KwaiYii-13B-Base在Benchmark上的效果(来源:快意GitHub主页)

而KwaiYii-13B-Chat对话模型具备出色的语言理解和生成能力,支持内容创作、信息咨询、数学逻辑、代码编写、多轮对话等广泛任务,人工评估结果表明KwaiYi-13B-Chat超过主流的开源模型,并在内容创作、信息咨询和数学解题上接近ChatGPT(3.5)同等水平。


KwaiYii-13B-Chat在人工评测上的效果(来源:快意GitHub主页)

据悉,目前「快意」已经开启内测,并为业务团队提供了标准API和定制化项目合作方案,以便在各种业务场景中进行测试和验证。


正在内测的「快意」对话平台

一直以来,快手AI团队都在专业领域有着出色的表现,研究成果频繁出现在国际顶级会议和期刊上,也多次在全球性比赛中获奖。2022年至今,快手AI团队已发表130多篇顶会论文,覆盖机器学习、自然语言处理、图像识别、语音识别、搜推广等多项研究领域,包含ICCV/CVPR (21), ACM MM (9) , KDD (9), SIGIR (9)等顶级会议。

此前,已有消息表明快手在大模型落地方面进展迅速。7月8日,快手宣布正在内测智能问答产品,在搜索场景中为用户带来智能问答和文本创作等新功能。8月8日,「快手AI对话」开启测试,以搜索场景为入口,为用户提供更多元、便捷的搜索形态,大为降低用户的搜索使用门槛,让新技术带来的便利惠及更广泛的人群。据悉,这两个新产品功能均基于「快意」大模型研发。

8月18日,「快手AI对话」功能已经在快手APP安卓版本开放内测,这也是短视频直播行业首个基于大语言模型落地的智能问答产品,在搜索场景中为用户带来智能问答和文本创作等新功能。参与测试的用户点击快手搜索首页右上角AI图标即可进入产品首页,选择输入内容对话或点击引导问题便可开启对话,或者触发「搜索智能问答」卡片,通过底部入口可以启用该功能。


快手App已内测AI对话功能

据称,快手AI团队将持续迭代「快意」大模型,一方面将继续优化模型性能并研发多模态能力,另一方面也在推进更多C端与B端业务场景下的落地。可以预见,随着如「快意」等大模型的不断发展,AI的应用边界将得到进一步的拓宽,将能为用户带来更丰富的产品体验和更高效的服务。

相关内容

热门资讯

如何允许远程连接到MySQL数... [[277004]]【51CTO.com快译】默认情况下,MySQL服务器仅侦听来自localhos...
如何利用交换机和端口设置来管理... 在网络管理中,总是有些人让管理员头疼。下面我们就将介绍一下一个网管员利用交换机以及端口设置等来进行D...
施耐德电气数据中心整体解决方案... 近日,全球能效管理专家施耐德电气正式启动大型体验活动“能效中国行——2012卡车巡展”,作为该活动的...
20个非常棒的扁平设计免费资源 Apple设备的平面图标PSD免费平板UI 平板UI套件24平图标Freen平板UI套件PSD径向平...
德国电信门户网站可实时显示全球... 德国电信周三推出一个门户网站,直观地实时提供其安装在全球各地的传感器网络检测到的网络攻击状况。该网站...
为啥国人偏爱 Mybatis,... 关于 SQL 和 ORM 的争论,永远都不会终止,我也一直在思考这个问题。昨天又跟群里的小伙伴进行...
《非诚勿扰》红人闫凤娇被曝厕所... 【51CTO.com 综合消息360安全专家提醒说,“闫凤娇”、“非诚勿扰”已经被黑客盯上成为了“木...
2012年第四季度互联网状况报... [[71653]]  北京时间4月25日消息,据国外媒体报道,全球知名的云平台公司Akamai Te...