历经一个月,首届通义千问ai挑战赛圆满落下帷幕。本届首届通义千问ai挑战赛由阿里云和nvidia英伟达联合主办,魔搭社区、阿里云天池平台、通义千问、codefuse支持承办。
本次大赛设置 code qwen能力算法赛道和 agent builder创意挑战赛道两个赛道,前者聚焦通义千问大模型的微调训练,期待通过高质量的数据探索开源模型的代码能力上限,后者鼓励开发者基于通义千问大模型和魔搭社区的agent-builder框架开发新一代ai应用,促进大模型在各行各业的落地应用。
本次大赛共吸引来自全国1216支队伍报名,初赛阶段共收到351个作品/成绩提交,20支队伍晋级复赛,展现了参赛选手们优秀的技术实力和创造力,最终20支队伍分享了17.5万元人民币的奖金池。
在通义千问ai挑战赛 - code qwen能力算法赛道上,众多参赛者凭借其卓越才智,在激烈的初赛和复赛中表现出色。编程能力是大型模型的关键能力之一,高效的生产效率不仅有助于提高有限算力的利用率,也可以加速对模型的迭代,主办方期待未来有更多基于大型模型的编程助手能够提高生产效率,成为不可或缺的智能化工具。
初赛阶段,参赛者围绕1.8b规模的开源qwen模型进行微调,目标是通过收集高质量数据来增强模型在代码生成和代码修复方面的性能。由于1.8b qwen模型对训练资源的需求相对较低,参赛者们得以充分发挥创意,积极搜集和打造高质量的代码监督数据,以此不断提高基础模型的表现。
在众多团队中,vscode团队和 jmxgodlzz团队表现尤为突出。特别是 jmxgodlzz团队,他们借鉴了“textbook is all you need”论文的方法,采用高质量书籍数据作为一阶段训练,随后以高质量指令数据进行二阶段训练,成功地将理论研究应用于实战中。
在复赛中,主办方提供了基于nvidia gpu的训练资源,参赛者利用nvidia tensorrt-llm等技术栈,在阿里云灵积平台上对72b qwen模型进行云端训练,期待大型模型能够像顶尖的编程专家那样在真实 leetcode上进行编程挑战。复赛期间,yyyyyjjjjj团队敏锐地意识到“有思路的刷题”对提升模型性能的重要性,他们通过构建大量的leetcode训练题目及其题解思路来增强模型的解题能力,最终拔得头筹。
在通义千问ai挑战赛 - agent builder应用赛道上,作品创意涵盖游戏、教育、法律、金融、工业等10多个领域,通过技术难度、应用前景、交互体验、人气值等维度决选出了10支团队及其作品来到线下进行复赛路演,最终由技术、业务、投资领域组成的专家团评选出最佳应用奖、最佳创意奖等6个奖项。
在众多团队中,“关风月w”的“看得见听得见的二次元女朋友”项目获得最佳应用奖,其通过多模态ai,结合文本、图像、音频和视频技术,创造出具有生动个性和强互动体验的数字人。用户能够复刻二次元角色、偶像或亲朋的声音与形象,同时利用先进语言模型定制数字人的特性,提供丰富多样的互动体验。
来自“jo了个jo”的“狗血故事无痛背单词”项目获“最佳创意奖”,通过ai助手,将英语单词转化为容易记忆的有趣小故事,该项目创新性地解决了大规模词汇记忆的挑战,使英语学习变得轻松有趣。
获奖名单
code qwen能力算法赛道:
agent builder创意挑战赛道:
在本次大赛中,不论是通过高质量数据微调提升基础语言模型低代码能力,还是围绕场景创作好玩和有用的ai智能体创意应用,我们都惊喜地看到了开发者们的无限探索力和创造力。