广州日报讯 (全媒体记者 文静)3月16日,百度突然对外公布了两款大模型,并在文心一言官网中对个人用户开放免费使用,这比百度此前公布的免费时间提早了。
今年一季度,被DeepSeek激发的新一轮大模型竞争持续不断、越演越烈,腾讯混元、阿里的通义与夸克、字节跳动的豆包、京东云的言犀等都相继“搬出”旗下的新品、新功能,将大厂之间的大模型竞赛“火力”升级。此前外界称百度在这次大模型的赛道是“起个大早赶个晚集”,如今突然将新模型产品的免费时间提前,以及降低API调用价格,能否将上半年大模型的市场空间再次抢回来?
文心一言提前15天免费
百度之前宣布文心一言将于4月1日免费。如今提前了15天,足见百度对今年上半年大模型市场的“紧张”程度。
最近一段时间,百度对大模型的策略逐渐发生改变,其中包括从闭源到开源的转变。在2月份的2024年四季度以及全年财报电话会议上,李彦宏表示,“从DeepSeek身上,我们学到了一件事,开源最佳模型能大大促进人们使用或采纳这个模型。”并且表示,百度决定开源文心大模型4.5系列。此外,对于大模型的成本,李彦宏近日称,将通过人工智能四层技术栈,即芯片、模型、框架、应用之间的端到端优化,大幅降低大模型预训练成本和推理成本。“随着大模型技术的迭代和成本的直线下降,我们将进入一个真正的变革阶段,迎来人工智能应用的大爆发。”
大厂大模型战略逐步调整
除了百度,腾讯、阿里、字节、京东等多家大厂的大模型发展都聚焦在“开源”“深度推理”以及API调用价格大幅下降等方向。2月底3月初,腾讯元宝正式上线电脑版,同时混元Turbo S灰测上线元宝。对于Turbo S,腾讯称其为“快思考模型”,而且该模型的API调用价格,相比前代要下降数倍。3月10日,字节豆包大模型团队就官宣开源一项针对MoE架构的关键优化技术,可将大模型训练效率提升1.7倍,成本节省40%。
大厂们都如此“着急”地将最新的大模型成果抛出市场,一方面是受到模型普及趋势影响,另一方面,明显是提早应对DeepSeek新一轮竞争。值得关注的是,上周有消息传出,DeepSeek会在3月17日推出最新下一代模型R2。尽管DeepSeek方面很快辟谣上述是假消息,然而,凭借DeepSeek的热度,若新一代R2横空出世,有望再次引起国民级的讨论热度。
观察
正面迎战DeepSeek 胜算几何?
此次百度公布的两款模型当中,文心大模型X1是深度思考模型。百度对外称:“X1不仅在性能上对标DeepSeek-R1,而且增加了多模态能力和多工具调用。”而且在价格上仅为R1一半。
无论从免费的时间节点,还是定价策略来看,此次百度直接迎战DeepSeek的决心十足。资深产业观察家丁少将对记者表示,百度将文心一言免费时间提前,一方面源于市场的竞争压力,因为AI大模型、开源应用每推迟一天就有可能会损失更多的客户和用户。损失了潜在客户和用户,这对于大模型的技术进化也会造成影响。另一方面从竞争角度而言,大模型的竞争一定会归结到整个AI大模型产业生态的竞争,一旦错过了时机就很难通过单点技术来取胜,甚至撼动整个产业生态。
对于百度与DeepSeek之争,丁少将认为,“目前来看,DeepSeek有市场的先发优势,它的模型技术和生态还在快速迭代过程。百度之前在AI大模型领域有一定积累,包括数据、算力以及产业生态积累,因此,未来双方在市场的竞争状况要进一步观察。”