ai大模型发展进入第二阶段，落地范式与评测标准成焦点-凯发k8官网

时至年末，关于ai大模型未来发展的话题也再次引发行业热议。

日前在北京举行的2023智用大会上，一大批人工智能产业应用相关成果集中发布，包括重点解决行业企业智能化三大问题“我能干么？”、“我找谁干？”、“我怎么干？”的数字产业生态服务体系、以场景应用为牵引的人工智能评测体系、大模型行业应用白皮书及ai大模型人才发展报告、“致用”ai人才培训体系、为千行百业提供智能化转型服务的智算云平台等。

当前，ai大模型或者说生成式人工智能，已经度过了由技术驱动的“第一阶段”，正在向由客户需求驱动的“第二阶段”迈进。和第一阶段“基础大模型”纷纷出现，推动ai完成了从判别式向生成式、从定制向通用的转化不同，第二阶段随着资本的继续涌入，激发了大模型在具体产业场景中实现落地，开始在磨合中探索大模型赋能千行百业的正确模式，形成一批“大模型产业应用”。

总体而言，大模型落地产业端进行应用是一个必然趋势。大模型也被普遍视为未来两年内产业数智化升级和传统工业转型先进制造业的重要迭代方向，进而得到了产业端的提前关注。但在这个进程中，也需要正视其中的问题，我们不应该停止发展，而是应该善于在发展中发现和解决问题。

1、大模型产业应用落地的三种范式和三大挑战

随着时间的推移，世界科技飞速发展，在各个领域都越来越多的见到人工智能的身影，其在产业领域的影响尤为明显。在可预见的未来，人工智能技术将会进一步的推动产业升级和变革。

中关村智用人工智能研究院院长孙明俊表示，从生产力的角度，ai是又一次产业革命的蒸汽机。ai正在让人类与生产资料逐渐脱离，这是与之前的蒸汽机、电力、计算机几次革命相比最大的不同。新的ai时代，政府、传统企业、科技企业，每一个角色，不仅要去拥抱ai带来如同蒸汽机一样提高生产力的红利，还要不断思考和适应人与生产资料逐渐脱离的生产关系下，如何去建设更美好、更和谐的社会和组织。

目前，在能源、制造业、金融、it服务、互联网及电商、咨询服务、公关广告、出版、游戏、软件开发以及医疗健康等行业，都已经有企业在尝试利用大模型提升自身的业务水平，为问题找到更好的凯发k8官网的解决方案。在这个趋势下，大模型的产业应用会进一步提速，产业大模型应用的数量也会大幅增加。这将带来两个直接影响：一个是实体产业端智能化、高端化、绿色化升级的浪潮会催生出更多丰富的科技工具、展现出更具爆发力和指数级的科技转型效果；另一个则是实体产业端将会感受到“乱花迷人眼”，在汹涌而来的ai产业大模型应用面前难以进行全面而精准的决策判断。

而在大模型产业应用落地上，目前行业已大致形成了三种共性范式：

第一种范式是关注“以产定销”多于“以销定产”。对于“以产定销”这类的企业，其业务存在明显的需求刚性，主要以能源行业为代表，因为在电力、石油等能源产品供不应求的前提下，他们更关注的是如何降低成本、提高效率。而“以销定产”这类的企业，主要代表之一为轻工业产品的生产者，例如服装厂永远要考虑如何按照实际需求，安排产能生产当季最流行的服装，多生产并不能天然带来更多销售和更高的效益，将流量转化为销售业绩并非大模型的特长。因此，ai大模型将工作重心放在“以产定销”类客户，可能更适合当前大模型的技术能力，也有助于应用落地。

第二种范式是基于技术能力和数字化基础解决实际问题。从技术供给维度，围绕大模型最擅长的文本理解、内容生成、逻辑推理、编程语言处理等核心能力所搭建，并且以知识问答、辅助决策、人机互动、内容生成等功能为基础的行业应用，最容易快速落地，也最容易取得成效。从客户需求维度，其业务已经实现了较高的信息化，乃至数字化的行业和客户，才具有较好的数据基础和数字化环境，而大模型的训练和应用，必须依赖于大量的优质数据，而完整的端到端数字化环境，才会衍生出海量的数据处理和决策需求，而大模型可以帮助行业解决这些难题，提高决策效率和准确度。

第三种范式是基于企业特点选择细分赛道。不同类型的大模型技术供给企业，有不同的适应赛道，一方面企业需要根据自身的技术特长选择细分赛道，另一方面大型企业更适合选择具备较高通用性和进入门槛的大赛道，投入更多资源换取竞争优势；而中小企业更适合选择创新挑战性更强的细分赛道，虽然企业综合资源有限，但在细分领域可以形成更高的资源投入到，获得竞争优势。

可以说，从行业大模型应用来看，传统行业与大模型的融合必然是从意识到执行、从系统到工具全方位进行，称之为重构也不为过，但这个过程中也存在一定的挑战。这表现在以下三个方面：

其一、传统行业决策者还不够了解大模型技术，对大模型理解处于两个极端（完全不了解也不感兴趣，与我无关；或者过于迷信大模型，认为大模型无所不能），以至于不可能真正使用大模型技术解决自己的问题。

其二、大模型当前能力还不足以解决复杂的决策问题，只能解决简单的助手、生成等问题；大模型自身也还不足以解决用户全部需求，需要大量的工程化技术。然后，大模型的行业应用需要大量懂大模型技术，又懂行业需求的人才，如何快速培养能够了解大模型、使用大模型、分析大模型的人才也是未来值得关注的问题。

其三、在产业协同上，涉及不同领域的大模型如何进行协同，大模型所收集的数据如何确保其准确，也是未来大模型发展需要解决的问题。

这也就是说，从社会层面来看，大模型应用得越广泛，人们对其合规性、数字安全和隐私安全的关注就越密切。如何在大模型应用过程中保证技术合规，确保数据的安全性和用户隐私的保护，建立起对于用户信息保障的堡垒将是一个重要挑战。

2、百模大战隐现行业乱象，构建评测标准成共识

今年来，伴随着chatgpt在全球的火爆，国内也迅速进入了“百模大战”甚至是“千模大战”，通用型以及垂类型在各个领域是百花齐放。但这种火热的另一面，是对大模型套壳、造假的质疑。

最近，从谷歌新发布的ai模型gemini演示视频的造假，到外媒曝出字节跳动使用openai技术开发自己的大语言模型，违反了openai服务条款，因此被暂停了账户。“百模大战”的激烈竞争以及引发的乱象，也让业界对大模型评测标准以及统一规范提出了新的课题。

当前，国内部分大厂具有多条“大模型产品线”，公开信息显示，截至目前，国内至少有23家大模型通过《生成式人工智能服务管理暂行办法》备案。这意味着算法备案已成为aigc产品的向社会公众开放、进入商用市场的重要门槛。所谓大模型备案，是指大模型产品在向公众开放及商用之前，经过监管部门的备案审批。没有经过备案，就只能小范围内测，大部分人无法注册使用，而通过备案的大模型产品或服务即可面向社会全面开放服务。

由于大模型的复杂性和应用场景的多样性，如何评价其性能和效果，证明产业大模型应用的价值，成为面向下一阶段的一个极具挑战性的问题。也因此，建立一套科学、合理、完善的评价体系对于大模型的应用至关重要，它能够推动技术进步，促进产业发展，同时确保技术应用的合规性和社会效益。

图片 3.png

此前，中国质量认证中心发布了人工智能评测体系，综合人工智能企业科技信用评级、算法适配度评测、大模型应用能力评测及芯片适配评测评价维度，旨在通过权威第三方评测，将企业技术能力、算法与场景的适配能力、大模型应用能力、芯片与算法适配能力的黑箱，变成人人可懂的白盒，帮助垂类企业选择更适合所属行业场景的相关产品和供应商，权威技术识别“工具”，助力传统行业的智能化转型升级。

智用研究院院长孙明俊表示：“组织大模型评测的目标是为了解决众多垂类行业用户对于大模型能力和特点的认知需求，建立一套具有中国特色、由丰富行业场景引导的评测体系，对大模型的垂直行业应用能力进行技术评判，推动产业的健康发展。”

首先，统一的评价标准可以帮助产业端更加客观地比较不同大模型的性能。通过标准化流程和指标体系，产业端可以从多个维度对大模型进行综合评估，包括业务需求满足度、算法的准确性、效率、及模型的安全性等。这样，产业端不仅可以评估模型的技术性能，还可以评价其在实际应用中的表现，从而挑选出更适合特定场景需求的模型。

其次，完善的评价体系对于推动大模型的健康发展具有重要意义。一些厂商可能会通过“刷榜”等不正当手段提高模型在某些基准测试上的表现，这种现象不仅损害了公平竞争的环境，还可能导致模型过度优化，从而降低其泛化能力和长期稳定性。一个完善的评价体系能够有效地减少这类问题，鼓励厂商专注于提升模型的实际应用性能。

此外，标准化的评价体系有助于促进大模型的产业化应用。模型开发只是第一步，如何有效地部署、运营和维护模型，以及如何确保其在实际应用中的稳定性和可靠性，同样重要。产业大模型标准，覆盖了模型化、能力化、工程化、产业化等各个方面，有助于推动大模型从研发到应用的全过程标准化，提升整个行业的水平。

最后，一个良好的评价体系还应当关注模型的伦理和社会影响，确保其应用不仅技术上先进，而且符合伦理和道德的标准，防止ai滥用和保护用户权益的法律和规制等，从多个维度规避ai风险，满足社会正向发展的需求。

中关村智用人工智能研究院首席研究员钱雨也指出，评估产业大模型应用的效果和价值包括可控性、能力增强、算力性价比、安全性和部署可行性五大核心指标。在实际应用中，需要根据具体场景和需求来平衡和优化这些指标，以实现最佳的应用效果。同时，随着技术的不断进步和应用场景的不断拓展，这些指标也将不断发展和完善。

而从更长的维度来看，围绕ai大模型的发展，除了应用落地和评测标准建立外，还面临着一些基础层的挑战和问题。算力体量、成本和数据体量都亟需进一步改善；数据安全、隐私保护、算法公平等问题需要得到充分关注和解决；大模型的产业应用和交叉领域建设，更需要培养和提升一大批产业内数智化人才的梯队储备。

3、结语

当前，ai大模型仍在加速发展，有机遇也有挑战。

面向未来，从政产学研用通盘视角来看，政策端需要做好统筹政策调度、支持孵化大模型产业生态和相应的创新要素供给，以更好的促进科技成果转化和产业大模型的落地成熟化、规模化；技术端需要推动软硬件技术一体化的进一步提升，为大模型的产业端应用提供更牢固的技术基础；产业端则需要提升产业对大模型和数智化应用升级的知识认知、能力建设和人才培养，并结合当前产业大模型训练需求，协助和支持科研界将大模型成果务实落地，提炼出更多产业内关键场景，商业痛点和行业数据。

ai大模型发展进入第二阶段，落地范式与评测标准成焦点-凯发k8官网

发布时间：2023-12-26 10:40:11 | 来源：中国网科学 | 作者： | 责任编辑：科学频道