12月22日,中国计算机学会主办的首届「ccf计算经济学比赛-博金挑战赛」结果出炉,并于香港中文大学(深圳校区)举行颁奖典礼暨路演活动。
比赛于2023年10月开始报名,并于12月进入决赛,得到了全国各高校师生和业界代表的广泛关注和参与。赛程期间,我们与来自全国的近千支队伍携手共进,赛事组委会共收到来自北京大学、清华大学、上海交通大学、浙江大学、中国人民大学、香港中文大学(深圳)、中国科学技术大学、华中科技大学、南方科技大学等高校和企业团队的诸多优秀成果。经过激烈的角逐,博金量化模型挑战赛和博金大模型挑战赛各产生六支优胜队伍。
在博金大模型挑战赛中,来自交通银行的队伍夺得一等奖,来自快确信息、华夏基金的两支队伍夺得二等奖,来自北京大学和信达证券、厦门大学、(原)德勒和(原)蚂蚁集团及(原)微软的三支队伍夺得三等奖。
在博金量化模型挑战赛中,来自香港中文大学(深圳)和中央财经大学的队伍夺得一等奖,来自南方科技大学和山西财经大学的两支队伍夺得二等奖,来自北京大学和武汉大学、浙江大学、中国科学技术大学的三支队伍夺得三等奖。
获奖队伍与决赛评委合影
中国计算机学会计算经济学专委会主任邓小铁教授介绍,本届比赛旨在提升中国计算经济学的整体水平,尽早发现、集聚和培养中国计算科学与经济科学交叉融合发展的优秀潜在人才,吸引更多专业研究人员加入到此领域的科研工作和产业应用中,积极促进我国计算经济产业的发展,同时提高在国家科技活动、社会服务和国际学术方面的影响力。
【博金大模型挑战赛中的创新亮点】
赛事亮点与难点
1.赛题融合了agent理念的应用挑战
未来金融科技领域将深刻体现agent的价值,即一个智能代理能根据用户需求进行意图识别和决策。本次大赛的赛题融合了数据查询与文本理解两大任务,充分体现了agent核心思想:根据不确定输入,判断用户意图,并调用相应服务或功能生成答案。
2.模型应用
选手需以“通义千问金融大模型”作为基础大模型,创建一个问答系统。可以采用prompt engineering方法,也可以使用外部数据对模型进行微调。
3.数据查询题挑战
任务目标:使用通义千问金融大模型,根据用户的问题进行高准确率的查询。
技术难题:处理多表之间的复杂关联,如理解基金股票持仓明细与a股日行情表的连接,并确保查询的高准确性。
4.文本理解题挑战
任务目标:对长文本进行细致检索与解读,高效提取关键信息。
技术难题:处理长文本的复杂结构,确保信息完整性。对超长文本,选手需合理分块,并从文档分块中准确提炼答案。
队伍风采与创新方案
【一等奖:饺子研究院】
在应对赛题挑战的过程中,来自交通银行的饺子研究院通过指令精调技术显著增强模型的意图识别和nl2sql能力;采用few-shot prompt方法实现工程初始化,构建高质量、多样化的训练数据集;面向金融领域的创新性文档抽取与清洗算法;高效且精确的信息检索策略:双路检索召回实现高效计算和最大化召回率,确保关键信息的完整性,精排阶段旨在提升精准率并减少冗余信息;幻觉检查修正算法实现llm可控生成。通过综合应用这些算法模型,构建了一套精准、泛化、通用、幻觉可控的智能金融问答系统,该系统能够处理金融文本与数据中的专业术语和复杂知识,用ai实现专家级别的查询与分析。该方案对当下大模型技术细节的娴熟掌握和成功应用,不仅取得了赛道top1的好成绩,在评审研讨会中也获得了评委老师的高度评价。
“饺子研究院”获博金大模型挑战赛一等奖
【二等奖:果树灌溉技术组】
本支队伍来自快确信息,凯发k8官网的解决方案中的算法pipeline具体分为三个模块。在问题分类模块中,引入多路召回结果辅助验证问题类别。在数据查询sql模块,应用了样本增强,并利用lora模型微调拓展模型对sql指令生成能力;筛选金融领域特定case,相比纯prompt的输入,提高模型的生成对齐效果;应用end2end + data driven训练方式,扩展性强,不需要依赖过多的人工介入。在文本查询ipo模块,进行细粒度分块,行作为chunksize,能够排除大量的干扰信息;结构化pdf文档,召回重排方案中,不仅能够在考虑“行”的文本内容,还可以根据标题考虑上下文内容;复召文本,补全文档内容上下文,后续充分发挥大模型能力对引用事实进一步判断相关性;prompt设计创新,针对tongyi-14b-chat金融场景角色话设计;应用in-context learning,多样化的实例选择,无需额外训练提升模型问答能力;实现prompt中文本重构,针对模型long context弱点,提升模型事实回答的准确性。
“果树灌溉技术组”获博金大模型挑战赛二等奖
【二等奖:hxjj】
这支来自华夏基金的队伍在挑战中采用agent的框架,基于modelscope-agent的框架进行改写。通过对agent框架的改写,使之能确定特定任务的流程,并准确地调用工具。对agent lora进行sft训练,通过构造数据提升泛化能力。通过agent构造思维链,提升最后预测的精度。
“hxjj”获博金大模型挑战赛二等奖
【三等奖:大模型说的队】
这支队伍由来自北京大学和信达证券的两名选手组成,采用的方案以检索增强上下文学习(rag-icl)为核心,以qwen14b-finance(简称qwen大模型)为主要工具,进行问题分类与回答。方案充分利用了qwen大模型的tokenizer部分包含的金融语境信息,在外来embedding检索效果较差的情况下,不训练新的embedding,达到了较好的检索效果。rag-icl为核心的方法使得队伍可以在仅标注较少数据集(不到200条)、不精调模型的情况下快速得到一个效果较好的问答系统。同时本方案具有较高的可解释性,只需修改rag-icl样本库中的例子就可以修改生成效果,对于可见的新问题类型也无需调整模型,只需补充rag-icl样本即可。
“大模型说的队”获博金大模型挑战赛三等奖(线上路演)
【三等奖:猫街四果汤】
本支队伍的参赛选手来自厦门大学,项目分为sql查询和文档检索理解两部分。其中,sql查询采用txt2sql方案,基于14b大模型fineturn一个lora模型,用来记住sql的表格信息和常用的sql语句表达式,然后再基于模板检索的方式回答问题;文档检索理解用相似度算法召回和排序关键句子,在语句检索上性能开销较小,然后再基于14b大模型抽取答案回答问题。方案在模型记忆和学习的创新点在于,通过lora模型记忆sql表格信息和常用sql语句表达式,使得模型能够更好地理解并生成符合要求的sql查询语句,这种记忆机制提高了模型的实用性和适应性。在资源优化和性能提升方面,在文档检索理解部分,采用相似度算法进行初步召回和排序,以减小性能开销,并在后续阶段利用大模型进行精细化答案抽取,以在性能和准确性之间取得平衡。
“猫街四果汤”获博金大模型挑战赛三等奖
【三等奖:梦想还是要有的】
本组应用的方案是lora后大模型意图识别(问题分类)方案。技术路线包括意图识别和nl2sql部分进行lora微调;召回类使用bm25效果好(由于不训练的向量召回);生成答案直接使用的prompt裸模型输出。创新点包括:根据query做bm25召回段落时,剔除query里的公司名字,改善召回效果;在pdf2txt中应用包含了章节标题自己的代码,提升效果。
“梦想还是要有的”获博金大模型挑战赛三等奖(线上路演)
【赛事背后的支持】
博金大模型挑战赛-金融千问数据集
博时基金与阿里云联手在金融领域推动ai应用的贡献显著。他们共同提供了一套结构化的金融数据库,涉及2019至2021年间的基金、股票、债券等多样金融数据,以及包括招股说明书在内的丰富文本资料。针对这些数据,他们设计了600道数据查询题和400道围绕招股说明书进行人工标注的文本理解题。这些题目旨在考察选手们如何利用大型语言模型来检索结构化数据和理解长文本,增加了比赛的难度和深度。
博时基金和阿里云通过提供算力资源、精心策划的赛题设计,以及日常的在线答疑服务,为比赛保驾护航。这场比赛不仅有望发掘具备优秀技术能力和金融知识的人才,而且强有力地推动了ai技术在金融领域的广泛应用,为金融科技领域开辟了新的篇章。
决赛评委合影
【评委点评】
邓小铁教授(中国计算机学会计算经济学专委会主任):在金融领域应用大模型是一种崭新的技术,本次比赛为我们展示了大模型赋能金融领域的无限可能,也为计算经济学领域的产学研结合提供了很好的样本,希望未来ccf计算经济学比赛可以继续下去,越办越好。
邓小铁教授发言
车宏原(博时基金董事总经理兼信息技术部总经理、人工智能实验室主任):本次比赛有两个特点,第一是技术新,紧抓大模型技术落地的最佳时机推出了本次赛题;第二是实用性强,赛题在金融行业中有着广阔应用场景,能够为理解金融应用提供很大的帮助。本次赛题涉及的领域知识库,是大模型应用里的一个关键技术,这一环节的攻坚将为大模型的应用提供深度的启发。感谢各位选手和组委会的努力,期待在未来与大家继续合作。
车宏原发言
高金杨(阿里巴巴通义实验室资深算法专家):阿里云为本次比赛提供了“通义千问金融大模型”和agent的核心思想,下一阶段阿里云将继续推进金融大模型社区的开源开放工作,希望能够与产业界和学界碰撞出更多的火花。
高金杨发言
张红庆(金证股份丽海弘金负责战略市场部):量化模型挑战赛的赛题涉及股票的短时价格预测,是一个充满噪声的数据处理场景,难点在于这一问题的开放性。尽管赛题富有挑战性,仍有一些出色的选手通过胜率证明了其卓越表现。这也显示了机器学习和金融工程结合的应用前景。作为承办方之一,金证股份很高兴能够参与本次比赛的组织,也希望能够继续与学界和产业界推进这类比赛的举办。
张红庆发言
魏立(博时基金行业研究部总经理):感谢组委会对本次比赛的支持和各位选手的努力。许多队伍的成果有着很好的应用潜力,让我看到了基于大模型的智能投研的光明前景。
魏立发言
王峰教授(武汉大学计算机学院软件工程系主任、中国计算机学会高级会员、中国计算机学会计算经济专业组执行委员):作为一名高校老师,我从各位选手的成果中受到了很多启发。非常感谢主办方和各大基金公司提供的一手数据,这些数据对于学术研究而言是一项非常宝贵的资源。我非常期待更多的学生和来自业界的人员参与到未来的比赛中,也希望大模型在金融以外的更多领域得到关注和应用。
王峰教授发言
李闽溟教授(香港城市大学教授):各个参赛队在本次比赛中的表现都可圈可点,尤其比赛中出现了高校学生和业界人员合作的团队,希望在未来的比赛中能看到更多的这样的组合,促进产学研的沟通交流。
李闽溟教授发言
朱垒磊(智唐科技董事长,ccf计算经济学专业组副主任):本次参赛队伍的能力水平和对大模型技术的理解与应用都达到了一定的深度。计算机经济学是一个广泛的学术领域,包括大模型技术与经济学的结合,运筹学、博弈论、强化学习等。比赛的三个赛道分别涉及强化学习、大模型技术和量化金融,展示了广泛的应用场景。希望未来的大赛能增加更多赛道,促进计算经济学领域的技术的深度参与和产学研团队的交流合作。
朱垒磊发言
李博(香港理工大学电子计算学系助理教授):非常荣幸参与到本次比赛的评选中,六支队伍的出色表现令我印象深刻。希望参赛选手在比赛的过程中有所收获,也预祝我们计算经济学比赛越来越成功,给越来越多的学界和业界创新人才提供更多的学习和展示才华的机会。
李博发言
谢艳(北大创新评论执行主编、ccf计算经济学专业组执委):感谢博时基金、阿里云和金证股份在2023年度计算经济学比赛基础数据、算力资源、赛题设计及比赛服务方面所做的卓越工作,为选手的精彩表现提供了数据和方法的基石。期待在未来的比赛中,数智化基础较好的金融赛道能够涌现出更多优秀的选手和出色的成果,同时更多产业方向可以加入计算经济学比赛及研究的创新发展!
谢艳发言
【获奖结果】
博金大模型挑战赛
一等奖
饺子研究院
二等奖
果树灌溉技术组
hxjj
三等奖
大模型说的队
猫街四果汤
梦想还是要有的
博金量化挑战赛
一等奖
干了!xdm!
二等奖
南科大的其中两个人
realmax
三等奖
5221
康德不眠之夜
啊对对队
【博金量化模型挑战赛大模型挑战赛主办方介绍】
主办单位
中国计算机学会(ccf)
中国计算机学会(ccf)成立于1962年,全国性学会,独立社团法人,中国科学技术协会成员。
ccf是中国计算机及相关领域的学术团体,宗旨是为本领域专业人士的学术和职业发展提供服务;推动学术进步和技术成果的应用;进行学术评价,引领学术方向;促进技术和产业应用一线的交流和互动;对在学术和技术方面有突出成就的个人、企业和单位给予认可和表彰。
承办专委
中国计算机学会计算经济学专业组
计算经济学专业组于2022年8月7日在中国计算机学会(ccf)苏州业务总部成立。计算经济学专业组是ccf第40个专业组,同时也是第一个具有跨学科融合特色的专业组。专业组由北京大学前沿计算中心邓小铁教授和北京大学经济学院董志勇教授,以及200余名专家、学者和企业负责人共同发起,并由邓小铁教授担任创始主任。
专业组的发展规划方向包括:推进计算机和经济学交叉研究,培养计算经济方向人才,加强专业组和政府部门联系,组织专业组与企业合作,牵头协作智库平台建设。研究方向包括:计算经济基础理论,平台经济,数字经济、智能治理和最优政策设计等。专业组致力于联系和团结本领域广大研究人员,组织学术活动,增进学术交流,促进计算经济交叉领域的研究与应用的发展。在ccf的领导下,专业组增强计算机领域在国家政策制定中的作用,广泛参与经济政策讨论和制定、协同其他ccf分支机构打造国家计算经济智库平台。
承办单位
北京大学前沿计算研究中心
北京大学前沿计算研究中心成立于2017年12月,为北京大学新体制科研机构,立足国际计算机学科前沿,与世界顶尖高校及科研机构建立密切的交流与合作关系,在计算理论如博弈论、信息论、量子信息与密码学,前沿计算方法如具身计算与人工智能,以及计算与机器人、经济、艺术和体育等多个领域的交叉方向展开前沿探索,创立具有国际一流影响力的计算科学研究中心;形成跨领域、交叉融合的计算应用支撑中心。
中心由图灵奖获得者、中国政府“友谊奖“获得者、中国科学院外籍院士、美国康奈尔大学教授/北京大学访问讲席教授约翰•霍普克罗夫特(john hopcroft)担任主任,中国工程院院士、北京大学博雅讲席教授高文担任联合主任。中心延揽国际杰出人才和深具潜力的青年学者,创建宽松自由的国际化学术环境,助力青年科学家成长计算机学科世界一流的青年学者;并以”图灵人才培养计划”为代表,建立国际先进的计算科学及相关交叉学科人才培养机制,为国家新时代科技和教育发展培养引领未来的卓越人才。
北大创新评论
北大创新评论(微信号:pkucxpl)由北京大学创办,为国内兼具权威学术背景及深度产业资源的产学研创新平台。北大创新评论专注于将产业经济理论、产业科学知识和产业创新应用工具传递给市场决策者,助推产学研多元智略的交叉融合与革新发展。
截至2023年12月,平台已与数万名活跃在中国市场经济领域的学术专家、产研学者、企业家交流合作,并辐射超过百万名对中国产业发展有绝对贡献的上市公司中高层、创新企业创始人群体。
协办单位
博时基金
博时基金成立于1998年,是中国内地首批成立的五家基金管理公司之一,致力为海内外各类机构和个人投资者提供专业、全面的资产管理服务。同时拥有博时基金(国际)有限公司、博时资本管理有限公司和博时财富基金销售有限公司三家子公司。
截至2023年9月30日,博时基金公司共管理356只公募基金,并受全国社会保障基金理事会委托管理部分社保基金,以及多个企业年金、职业年金及特定专户,管理资产总规模逾14570亿元人民币,剔除货币基金后,博时基金公募资产管理总规模逾5106亿元人民币,累计分红逾1884亿元人民币,是目前我国资产管理规模领先的基金公司之一。
金证股份
金证是一家深度伴随中国金融行业信息化建设进程的科技企业,也是我国金融it领域第一批上市公司,股票代码600446。
从1992年创业算起,金证已经有30年的金融it服务经历,广泛服务于证券、基金、银行、期货、信托、交易所等金融机构,以及上游监管机构,是国内领军的金融科技全领域服务商。
陪伴着中国资本市场一路成长,我们也从一家单纯的金融it公司发展成为一家综合性的金融科技企业集团,目前拥有20多家子公司,针对不同细分领域开展专业化经营,并在全国拥有3个产业园区,3大业务中心。
阿里云
阿里云创立于2009年,是全球领先的云计算及人工智能科技公司,致力于以在线公共服务的方式,提供安全、可靠的计算和数据处理能力,让计算和人工智能成为普惠科技。阿里云服务着制造、金融、政务、交通、医疗、电信、能源等众多领域的企业,包括中国联通、12306、中石化、中石油、飞利浦、华大基因等大型企业客户,以及微博、知乎等明星互联网公司。在天猫双11全球狂欢节、12306春运购票等极富挑战的应用场景中,阿里云保持着良好的运行纪录。