发布时间:2024-12-31 05:32:46 来源: sp20241231
在日前举行的2023阿里云栖大会上,阿里云正式发布千亿级参数大模型通义千问2.0,而在此之前,包括百度、腾讯、商汤、科大讯飞等的大模型,也纷纷宣布进行更新,国内的大模型呈现出加速迭代的态势。
作为如今最前沿的AI技术,大模型已经被业界普遍认为将是引领未来创新发展的基础和动力,而今通过更新迭代所出现的更为全能的大模型,又将为数字化的发展带来怎样的改变?
●南方日报记者 叶丹
国产大模型“从有到优”
在正式发布不到200天后,阿里云的大模型通义千问正式升级为2.0。据介绍,通义千问2.0在复杂指令理解、文学创作、通用数学、知识记忆、幻觉抵御等能力上均有显著提升。阿里云方面表示,目前通义千问的综合性能已经超过GPT-3.5,加速追赶GPT-4。
在相对国外的大模型产品更新速度上,通义千问已经体现出了“中国速度”,但是在国产大模型领域,“中国速度”还在不断地刷新:在正式曝光两个月后,腾讯混元大模型就迎来了全新升级,据腾讯方面介绍,升级后的腾讯混元中文能力整体超过GPT-3.5,代码能力大幅提升20%;在2023百度世界大会上,百度文心大模型4.0正式发布,据百度创始人、董事长兼首席执行官李彦宏介绍,文心大模型4.0在理解、生成、逻辑和记忆能力上都有显著提升,综合能力“与GPT-4相比毫不逊色”。此外据南方日报记者了解到,包括商汤“商量SenseChat2.0”、科大讯飞“讯飞星火”认知大模型V3.0、探迹科技探迹SalesGPT等国产大模型,也纷纷升级登场,一时间国产大模型开始进入了“从有到优”的发展阶段。
中国科学技术研究所发布的相关数据显示,截至今年5月,国产大模型发布数量已经超过了79个,众多大模型产品一拥而至,并不排除不少大模型只是“蹭风口”的出现,而真正在大模型赛道上领跑,更考验的是大模型的迭代能力。在业内人士看来,随着头部的国产大模型的加速更新,将与大多数大模型的能力拉开距离,最终起到“优胜劣汰”的效果。
“其实到今天,全社会更多关注的还是大模型发布,大家不太注意的一点是:这背后是整个云系统的升级,是技术体系的竞争。”阿里云CTO周靖人在接受采访时表示,不管未来通用大模型的格局是否集中,明确的趋势是推理(即使用大模型时的计算过程)对计算的需求会越来越大,远大于训练,而这也意味着只有足够技术积累的平台,才能够持续地投入大模型的更新迭代中。
国产大模型驶向应用“深水区”
在编码软件的对话窗口输入“帮我用python写一个飞机游戏”,短短几秒,名为“通义灵码”的AI助手就自动生成了100多行代码,点击运行后一个充满儿时回忆的“飞机大战”游戏就成功跑起来了。在本次云栖大会上,阿里云对外展示的可自动编写代码的AI助手通义灵码吸引了众多的目光。
据南方日报记者了解到,“通义灵码”是一款基于阿里云通义代码大模型打造的智能编码助手,基于海量优秀开源代码数据集和编程教科书训练,可根据当前代码文件及跨文件的上下文,自动生成行级/函数级代码、单元测试、代码注释等,此外还具备代码解释、智能研发问答、异常报错排查等能力,并针对阿里云SDK/OpenAPI使用场景调优,为开发者带来高效、流畅的编码体验。
在不少人印象中,大模型还是普通网民可以用文字进行对话的一个“闲聊”工具,但是随着大模型的不断发展,如今已经开始驶向TO B端的“深水区”了。此前探迹科技创始人兼CEO黎展就表示,大模型的出现,让所有行业都快速进入数据价值深挖阶段。据黎展介绍,作为业内首个销售大模型SaaS产品“探迹SalesGPT”,就运用了AI大模型针对企业线索挖掘、商机触达、营销、客户管理等To B企业销售场景进行功能价值挖掘,以一种更加高效、智能和简单的方式来实现智能销售。而中国科学技术研究所的报告就指出,在通用大模型以外,垂直大模型和行业大模型将是大模型应用落地的重要形式,基于通用大模型进行微调,通过训练专业数据,向各行各业等多个场景提供更加精准、高效的解决方案。
在业内人士看来,从与用户“瞎聊”得到训练的同时也让大众“尝鲜”,再到如今进入各个行业进行落地应用,国产大模型已经进入了全新的发展阶段。
“大模型只有真正应用于解决实际问题,才能发挥其真正的价值。”在李彦宏看来,未来各行各业基于AI应用不断涌现,将推动数字技术与实体经济深度融合,推动新型工业化才是文心大模型的目标。据悉,百度文心大模型已经在助力国图馆藏文化资源活化,升级国家跳水队AI辅助训练系统等多领域实践。
“我还没看到哪一个行业不会受这次AI变革的影响。”周靖人指出,AI本身还有很多工作,包括模型本身的进化,未来的多模态如何能把模型应用起来是行业发展的关键。在他看来,“这也许是一生中少有的计算技术革命。”(南方日报) 【编辑:曹子健】