国产大模型加速迭代，会带来什么

　　在日前举行的2023阿里云栖大会上，阿里云正式发布千亿级参数大模型通义千问2.0，而在此之前，包括百度、腾讯、商汤、科大讯飞等的大模型，也纷纷宣布进行更新，国内的大模型呈现出加速迭代的态势。

　　作为如今最前沿的AI技术，大模型已经被业界普遍认为将是引领未来创新发展的基础和动力，而今通过更新迭代所出现的更为全能的大模型，又将为数字化的发展带来怎样的改变？

　　●南方日报记者叶丹

　　国产大模型“从有到优”

　　在正式发布不到200天后，阿里云的大模型通义千问正式升级为2.0。据介绍，通义千问2.0在复杂指令理解、文学创作、通用数学、知识记忆、幻觉抵御等能力上均有显著提升。阿里云方面表示，目前通义千问的综合性能已经超过GPT-3.5，加速追赶GPT-4。

　　在相对国外的大模型产品更新速度上，通义千问已经体现出了“中国速度”，但是在国产大模型领域，“中国速度”还在不断地刷新：在正式曝光两个月后，腾讯混元大模型就迎来了全新升级，据腾讯方面介绍，升级后的腾讯混元中文能力整体超过GPT-3.5，代码能力大幅提升20%；在2023百度世界大会上，百度文心大模型4.0正式发布，据百度创始人、董事长兼首席执行官李彦宏介绍，文心大模型4.0在理解、生成、逻辑和记忆能力上都有显著提升，综合能力“与GPT-4相比毫不逊色”。此外据南方日报记者了解到，包括商汤“商量SenseChat2.0”、科大讯飞“讯飞星火”认知大模型V3.0、探迹科技探迹SalesGPT等国产大模型，也纷纷升级登场，一时间国产大模型开始进入了“从有到优”的发展阶段。

　　中国科学技术研究所发布的相关数据显示，截至今年5月，国产大模型发布数量已经超过了79个，众多大模型产品一拥而至，并不排除不少大模型只是“蹭风口”的出现，而真正在大模型赛道上领跑，更考验的是大模型的迭代能力。在业内人士看来，随着头部的国产大模型的加速更新，将与大多数大模型的能力拉开距离，最终起到“优胜劣汰”的效果。

　　“其实到今天，全社会更多关注的还是大模型发布，大家不太注意的一点是：这背后是整个云系统的升级，是技术体系的竞争。”阿里云CTO周靖人在接受采访时表示，不管未来通用大模型的格局是否集中，明确的趋势是推理(即使用大模型时的计算过程)对计算的需求会越来越大，远大于训练，而这也意味着只有足够技术积累的平台，才能够持续地投入大模型的更新迭代中。

　　国产大模型驶向应用“深水区”

　　在编码软件的对话窗口输入“帮我用python写一个飞机游戏”，短短几秒，名为“通义灵码”的AI助手就自动生成了100多行代码，点击运行后一个充满儿时回忆的“飞机大战”游戏就成功跑起来了。在本次云栖大会上，阿里云对外展示的可自动编写代码的AI助手通义灵码吸引了众多的目光。

　　据南方日报记者了解到，“通义灵码”是一款基于阿里云通义代码大模型打造的智能编码助手，基于海量优秀开源代码数据集和编程教科书训练，可根据当前代码文件及跨文件的上下文，自动生成行级/函数级代码、单元测试、代码注释等，此外还具备代码解释、智能研发问答、异常报错排查等能力，并针对阿里云SDK/OpenAPI使用场景调优，为开发者带来高效、流畅的编码体验。

　　在不少人印象中，大模型还是普通网民可以用文字进行对话的一个“闲聊”工具，但是随着大模型的不断发展，如今已经开始驶向TO B端的“深水区”了。此前探迹科技创始人兼CEO黎展就表示，大模型的出现，让所有行业都快速进入数据价值深挖阶段。据黎展介绍，作为业内首个销售大模型SaaS产品“探迹SalesGPT”，就运用了AI大模型针对企业线索挖掘、商机触达、营销、客户管理等To B企业销售场景进行功能价值挖掘，以一种更加高效、智能和简单的方式来实现智能销售。而中国科学技术研究所的报告就指出，在通用大模型以外，垂直大模型和行业大模型将是大模型应用落地的重要形式，基于通用大模型进行微调，通过训练专业数据，向各行各业等多个场景提供更加精准、高效的解决方案。

　　在业内人士看来，从与用户“瞎聊”得到训练的同时也让大众“尝鲜”，再到如今进入各个行业进行落地应用，国产大模型已经进入了全新的发展阶段。

　　“大模型只有真正应用于解决实际问题，才能发挥其真正的价值。”在李彦宏看来，未来各行各业基于AI应用不断涌现，将推动数字技术与实体经济深度融合，推动新型工业化才是文心大模型的目标。据悉，百度文心大模型已经在助力国图馆藏文化资源活化，升级国家跳水队AI辅助训练系统等多领域实践。

　　“我还没看到哪一个行业不会受这次AI变革的影响。”周靖人指出，AI本身还有很多工作，包括模型本身的进化，未来的多模态如何能把模型应用起来是行业发展的关键。在他看来，“这也许是一生中少有的计算技术革命。”（南方日报）【编辑:曹子健】

相关推荐