行业观察
在嘉宾们陆续输入“Olympics”“智能科技”“生态发展”“繁荣”“未来感”“地标建筑”等提示词后,屏幕上缓缓生成一幅充满想象力的AI亚运画卷,亚运各国标志性景观跃然屏上……这是发生在9月19日杭州亚运会数字科技体验中心举行的启动仪式上的一幕。这幅一秒绘就的亚运画卷,是阿里云AI大模型“通义万相”在杭州亚运会上的“首秀”。
大模型是当下科技行业最大的“风口”,其背后拼的是科技企业AI研发能力、大数据处理、算力投入的能力。据不完全统计,目前全国范围已发布124个大模型,整体呈现“百模大战”状态。从下半年开始,大模型走向“实打实”的近身搏斗。
文、表/广州日报全媒体记者 文静、邓莉、陈薇薇
ChatGPT出现,让大家知道了大模型。目前TO C端的大模型产品主要聚焦在大语言模型,记者浏览多款主流的大模型,其功能上“大同小异”,最基础的功能是“对话”,即对大模型发出一条指令,大模型会根据诉求完成一份较为完整的文本。
而行业大模型则是大厂们展现真正AI实力的“战场”。
“拼”B端:抢占优势行业,加码打造“样板”
国内通信技术“巨头”华为大模型“落地”之初,已明确“剑指”行业,同时与华为其他TO B端业务类似,利用“样板”来占据有利位置。7月中旬,山东能源集团、华为、云鼎科技联手发布盘古矿山大模型,这距离华为盘古大模型3.0亮相不到半个月时间。
阿里、腾讯,作为综合性互联网大厂,“自家”研发的大模型固然先将其融合到多项业务,提升AI水平,实现降本增效。早在今年4月通义千问发布会上,彼时阿里云智能CEO张勇表示,阿里所有产品未来将接入该大模型。目前,通义大模型已在淘宝中应用。
据了解,腾讯混元大模型已接入腾讯50多个业务并取得初步效果,包括腾讯云、腾讯广告、腾讯游戏、腾讯金融科技等业务和产品。
“拼”研发投入:发力算力领域,版本加速迭代
算力、算法与大数据被称为大模型的三驾马车。作为AIGC(生成式人工智能)时代的重要核心,大模型需要庞大的算力来支撑。9月20日,华为副董事长、轮值董事长、CFO孟晚舟表示:“在全面智能化战略的指引下,华为将持续打造坚实的算力底座,使能百模千态,赋能千行万业。”
“BAT”阿里、腾讯、百度也在算力领域“奋力”投入。“目前阿里云机器学习平台PAI提供AI开发全流程的工程能力,可将大模型训练时间缩短10倍。”阿里巴巴集团副总裁、达摩院城市大脑实验室负责人叶杰平近日接受采访时表示。
腾讯亦在缩短大模型的训练时间上下功夫。腾讯表示,腾讯云高性能计算集群产品HCC已全面升级至2.0,相比上代训练效率提升幅度达到3倍,将几十天的训练周期缩短至一周内。
经过迭代,百度文心一言基础模型已升级到文心大模型3.5,训练速度达到原来的3倍,推理速度达到原来的30多倍。
行业观察
大模型“落地”应用才能打开更大空间
从去年底ChatGPT的爆发,到今年百度、阿里、华为、腾讯等大模型逐步“落地”,短短大半年时间,国内大模型“百花齐放”。据不完全统计,目前全国范围已发布124个大模型。然而,随着跟大模型“聊天”的热潮减退,大模型到底能为我们做什么,成为整个行业的思考。
记者在对多家大厂的采访中了解到,商业化是大厂在大模型进程中尤为关键的一步。有大厂高管层坦言,从衡量大模型本身的商业价值角度看,如果应用不起来,整个大模型很难持续下去,确实是需要投入,整个生态起来、应用繁荣很重要。
华金证券最新研报指出,大模型从通用走向垂直场景更多的是对商业化落地的探索,是大模型从训练走向推理的动能,伴随着垂直大模型的发展完善,大模型的应用才是打开更大成长空间的关键。