高能对决,创意迸发,首届通义千问AI 挑战赛落幕
创始人
2025-07-11 06:20:31
0

历经一个月,首届通义千问AI挑战赛圆满落下帷幕。本届首届通义千问AI挑战赛由阿里云和NVIDIA 英伟达联合主办,魔搭社区、阿里云天池平台、通义千问、CodeFuse支持承办。

本次大赛设置 Code Qwen能力算法赛道和 Agent Builder创意挑战赛道两个赛道,前者聚焦通义千问大模型的微调训练,期待通过高质量的数据探索开源模型的代码能力上限,后者鼓励开发者基于通义千问大模型和魔搭社区的Agent-Builder框架开发新一代AI应用,促进大模型在各行各业的落地应用。

本次大赛共吸引来自全国 1216 支队伍报名,初赛阶段共收到 351 个作品/成绩提交, 20 支队伍晋级复赛,展现了参赛选手们优秀的技术实力和创造力,最终20支队伍分享了17.5万元人民币的奖金池。

在通义千问AI挑战赛 - Code Qwen能力算法赛道上,众多参赛者凭借其卓越才智,在激烈的初赛和复赛中表现出色。编程能力是大型模型的关键能力之一,高效的生产效率不仅有助于提高有限算力的利用率,也可以加速对模型的迭代,主办方期待未来有更多基于大型模型的编程助手能够提高生产效率,成为不可或缺的智能化工具。

初赛阶段,参赛者围绕1.8B规模的开源Qwen模型进行微调,目标是通过收集高质量数据来增强模型在代码生成和代码修复方面的性能。由于1.8B Qwen 模型对训练资源的需求相对较低,参赛者们得以充分发挥创意,积极搜集和打造高质量的代码监督数据,以此不断提高基础模型的表现。

在众多团队中,VSCODE 团队和 JMXGODLZZ 团队表现尤为突出。特别是 JMXGODLZZ 团队,他们借鉴了“Textbook is All you need”论文的方法,采用高质量书籍数据作为一阶段训练,随后以高质量指令数据进行二阶段训练,成功地将理论研究应用于实战中。

在复赛中,主办方提供了基于NVIDIA GPU的训练资源,参赛者利用NVIDIA TensorRT-LLM等技术栈,在阿里云灵积平台上对 72B Qwen模型进行云端训练,期待大型模型能够像顶尖的编程专家那样在真实 leetcode 上进行编程挑战。复赛期间,yyyyyjjjjj 团队敏锐地意识到 “有思路的刷题” 对提升模型性能的重要性,他们通过构建大量的leetcode训练题目及其题解思路来增强模型的解题能力,最终拔得头筹。

在通义千问AI挑战赛 - Agent Builder应用赛道上,作品创意涵盖游戏、教育、法律、金融、工业等10多个领域,通过技术难度、应用前景、交互体验、人气值等维度决选出了10支团队及其作品来到线下进行复赛路演,最终由技术、业务、投资领域组成的专家团评选出最佳应用奖、最佳创意奖等6个奖项。

在众多团队中,“关风月W”的“看得见听得见的二次元女朋友”项目获得最佳应用奖,其通过多模态AI,结合文本、图像、音频和视频技术,创造出具有生动个性和强互动体验的数字人。用户能够复刻二次元角色、偶像或亲朋的声音与形象,同时利用先进语言模型定制数字人的特性,提供丰富多样的互动体验。

来自“JO了个JO”的“狗血故事无痛背单词”项目获“最佳创意奖”,通过AI助手,将英语单词转化为容易记忆的有趣小故事,该项目创新性地解决了大规模词汇记忆的挑战,使英语学习变得轻松有趣。

获奖名单

Code Qwen能力算法赛道:

Agent Builder创意挑战赛道:

在本次大赛中,不论是通过高质量数据微调提升基础语言模型低代码能力,还是围绕场景创作好玩和有用的AI智能体创意应用,我们都惊喜地看到了开发者们的无限探索力和创造力。

相关内容

热门资讯

如何允许远程连接到MySQL数... [[277004]]【51CTO.com快译】默认情况下,MySQL服务器仅侦听来自localhos...
如何利用交换机和端口设置来管理... 在网络管理中,总是有些人让管理员头疼。下面我们就将介绍一下一个网管员利用交换机以及端口设置等来进行D...
施耐德电气数据中心整体解决方案... 近日,全球能效管理专家施耐德电气正式启动大型体验活动“能效中国行——2012卡车巡展”,作为该活动的...
Windows恶意软件20年“... 在Windows的早期年代,病毒游走于系统之间,偶尔删除文件(但被删除的文件几乎都是可恢复的),并弹...
20个非常棒的扁平设计免费资源 Apple设备的平面图标PSD免费平板UI 平板UI套件24平图标Freen平板UI套件PSD径向平...
德国电信门户网站可实时显示全球... 德国电信周三推出一个门户网站,直观地实时提供其安装在全球各地的传感器网络检测到的网络攻击状况。该网站...
着眼MAC地址,解救无法享受D... 在安装了DHCP服务器的局域网环境中,每一台工作站在上网之前,都要先从DHCP服务器那里享受到地址动...
为啥国人偏爱 Mybatis,... 关于 SQL 和 ORM 的争论,永远都不会终止,我也一直在思考这个问题。昨天又跟群里的小伙伴进行...