“百模大战”聚焦B端垂直场景

文静、邓莉、陈薇薇

本文字数：#article-word-count#

　　行业观察

　　在嘉宾们陆续输入“Olympics”“智能科技”“生态发展”“繁荣”“未来感”“地标建筑”等提示词后，屏幕上缓缓生成一幅充满想象力的AI亚运画卷，亚运各国标志性景观跃然屏上……这是发生在9月19日杭州亚运会数字科技体验中心举行的启动仪式上的一幕。这幅一秒绘就的亚运画卷，是阿里云AI大模型“通义万相”在杭州亚运会上的“首秀”。

　　大模型是当下科技行业最大的“风口”，其背后拼的是科技企业AI研发能力、大数据处理、算力投入的能力。据不完全统计，目前全国范围已发布124个大模型，整体呈现“百模大战”状态。从下半年开始，大模型走向“实打实”的近身搏斗。

　　文、表/广州日报全媒体记者文静、邓莉、陈薇薇

　　ChatGPT出现，让大家知道了大模型。目前TO C端的大模型产品主要聚焦在大语言模型，记者浏览多款主流的大模型，其功能上“大同小异”，最基础的功能是“对话”，即对大模型发出一条指令，大模型会根据诉求完成一份较为完整的文本。

　　而行业大模型则是大厂们展现真正AI实力的“战场”。

　　“拼”B端：抢占优势行业，加码打造“样板”

　　国内通信技术“巨头”华为大模型“落地”之初，已明确“剑指”行业，同时与华为其他TO B端业务类似，利用“样板”来占据有利位置。7月中旬，山东能源集团、华为、云鼎科技联手发布盘古矿山大模型，这距离华为盘古大模型3.0亮相不到半个月时间。

　　阿里、腾讯，作为综合性互联网大厂，“自家”研发的大模型固然先将其融合到多项业务，提升AI水平，实现降本增效。早在今年4月通义千问发布会上，彼时阿里云智能CEO张勇表示，阿里所有产品未来将接入该大模型。目前，通义大模型已在淘宝中应用。

　　据了解，腾讯混元大模型已接入腾讯50多个业务并取得初步效果，包括腾讯云、腾讯广告、腾讯游戏、腾讯金融科技等业务和产品。

　　“拼”研发投入：发力算力领域，版本加速迭代

　　算力、算法与大数据被称为大模型的三驾马车。作为AIGC（生成式人工智能）时代的重要核心，大模型需要庞大的算力来支撑。9月20日，华为副董事长、轮值董事长、CFO孟晚舟表示：“在全面智能化战略的指引下，华为将持续打造坚实的算力底座，使能百模千态，赋能千行万业。”

　　“BAT”阿里、腾讯、百度也在算力领域“奋力”投入。“目前阿里云机器学习平台PAI提供AI开发全流程的工程能力，可将大模型训练时间缩短10倍。”阿里巴巴集团副总裁、达摩院城市大脑实验室负责人叶杰平近日接受采访时表示。

　　腾讯亦在缩短大模型的训练时间上下功夫。腾讯表示，腾讯云高性能计算集群产品HCC已全面升级至2.0，相比上代训练效率提升幅度达到3倍，将几十天的训练周期缩短至一周内。

　　经过迭代，百度文心一言基础模型已升级到文心大模型3.5，训练速度达到原来的3倍，推理速度达到原来的30多倍。

　　行业观察

　　大模型“落地”应用才能打开更大空间

　　从去年底ChatGPT的爆发，到今年百度、阿里、华为、腾讯等大模型逐步“落地”，短短大半年时间，国内大模型“百花齐放”。据不完全统计，目前全国范围已发布124个大模型。然而，随着跟大模型“聊天”的热潮减退，大模型到底能为我们做什么，成为整个行业的思考。

　　记者在对多家大厂的采访中了解到，商业化是大厂在大模型进程中尤为关键的一步。有大厂高管层坦言，从衡量大模型本身的商业价值角度看，如果应用不起来，整个大模型很难持续下去，确实是需要投入，整个生态起来、应用繁荣很重要。

　　华金证券最新研报指出，大模型从通用走向垂直场景更多的是对商业化落地的探索，是大模型从训练走向推理的动能，伴随着垂直大模型的发展完善，大模型的应用才是打开更大成长空间的关键。

下载