广经观察
5月24日,科大讯飞股价午后一度逼近跌停。对此,科大讯飞回应称“股价下跌系某生成式AI写作虚假‘小作文’导致”,虽没有直接点名“友商”,但一张网传截图显示百度“文心一言”被要求写出一篇科大讯飞出现重大风险的警示文。5月25日A股科大讯飞续跌1.70%,截至北京时间5月25日晚23:05,百度美股微涨0.22%。
科大讯飞的回应,也引发了有关方面的“回怼”,据媒体的截图显示,5月24日晚,百度文心一言相关负责人张全文在社交平台发文质疑“小作文”的真伪。至截稿时,百度对事件暂无回应。
这场“口水战”的背后,是今年以来国内人工智能大模型激烈赛道竞争。从百度“文心一言”、阿里“通义千问”的发布,到360“360智脑”、腾讯“混元”、京东“ChatJD”、华为“盘古”等陆续登场,一时间,似乎各大产业和资本力量都唯恐错过这个“热门”领域。记者实测了多款人工智能大模型并观察了解这片“市场蓝海”,发现目前国内至少已经有30多家大模型亮相,各大企业也逐步细化“赛道”,选择了不同的布局方向。
文/广州日报全媒体记者 许晓芳、张露、文静
赛道火热: 龙头大模型大致分为通用型与产业型两大类
人工智能大模型当前包含自然语言处理(NLP)、计算机视觉(CV)等,统一整合的多模态大模型等。根据民生证券相关研报的统计,目前国内至少已经有30多家大模型亮相,出品方涵盖互联网巨头、AI概念上市公司、服务器龙头企业、科研院所与一级市场创业公司。依托这些大模型推出的类ChatGPT产品,主打的能力包括对话问答、文本及代码生成等。
今年3月16日,互联网巨头百度公布旗下语言大模型“文心一言”,之后公开内测,据百度日前公布的2023年第一季度财报披露,“文心一言”内测一个多月,完成了4次大的技术升级,大模型推理性能提升近10倍。而另一互联网龙头阿里大模型“通义千问”是今年4月举行的2023年阿里云峰会上,正式对外界揭开神秘面纱。阿里巴巴集团董事会主席兼CEO张勇透露,在未来,“通义千问”将接入阿里巴巴所有产品,包括淘宝、天猫、钉钉等。
天使投资人、知名互联网专家郭涛表示,未来,在人工智能大模型市场,将会形成以百度、科大讯飞、阿里巴巴等为代表的通用型大模型和以网易、京东等为代表的产业型大模型长期并存的局面,通用型大模型为众多行业或场景赋能,产业型为垂直行业赋能。
与百度、阿里等推出的大模型不同的是,华为推出的盘古大模型的重心是做好行业应用。据悉,华为基于盘古预训练大模型,打造了药物分子大模型、气象大模型以及矿山、电力、金融、轨道等行业大模型,让人工智能开发标准化、可复制、批量化生产,加速AI深入千行百业。
人工智能龙头企业科大讯飞则宣布实力已超越ChatGPT,其董事长刘庆峰则在“讯飞星火认知大模型成果发布会”上表示,当前“讯飞星火认知大模型”在文本生成、知识问答、数学能力三大能力上已超ChatGPT。同时公布大模型年内三次升级时间点,10月底将整体赶超ChatGPT。
内部人士: 未来一段时间 大模型和搜索引擎互为存在
截至目前,百度的“文心一言”、阿里的“通义千问”等多个模型都还处于内测阶段。但已经引来部分对于其回答的时效性、准确度的质疑。
3月23日,有微博博主发文质疑“文心一言”文生图功能抄袭“StableDiffusion”,同时在中文语义理解方面存在局限。随后,百度在其官方微博发说明表示,“文心一言”完全是百度自研的大语言模型,文生图能力来自文心跨模态大模型ERNIE-ViLG。在大模型训练中,其使用的是互联网公开数据,符合行业惯例,大家也会从接下来文生图能力的快速调优迭代,看到百度的自研实力。百度更称,“文心一言”正在大家的使用过程中不断学习和成长,请大家给自研技术和产品一点信心和时间,不传谣不信谣。区别于“文心一言”有文生图的功能,“通义千问”没有制图能力。
业内人士表示,当前用户许多时候使用大模型会发现,不少数据内容较久远,甚至不准确。这是国内大模型普遍存在的问题,它需要不断地训练与大量的数据。企业内部人士坦言,未来一段时间,大模型与搜索引擎互为存在,往往在大模型获得的一些信息,需要在搜索引擎上验证是否准确。目前,百度与阿里两大互联网巨头均表示,大模型将整合到所有业务当中。
前路如何: 亟须加强底层软件、超算系统和产学研合作
对于未来国内人工智能大模型的发展,华南理工大学工商管理学院二级教授张振刚表示,要取得较好的市场发展,国内人工智能企业首先要进一步加强基础软件的开发工作。因为人工智能模型需要对概念模型、物理模型和数学模型等多方面的知识和信息进行高度集成和综合,需要大型的技术软件作为支撑底座,所以各有关企业要加强底层基础软件的开发。“其次,人工智能企业要加强产学研合作,是因为企业在数据的获取和分析方面有优势,高校在基础理论研究方面具有优势,而人工智能的特点在于海量数据处理,因此产学研多方结合起来有助于优势互补,推动人工智能实现更高水平的发展。”张振刚表示。
此外,还要进一步加强算力等基础设施建设。“人工智能最大的特点就是所需的数据量很大,是多机协同运行,所以要大力建设超级计算网络等基础设施。”张振刚认为,今后的大模型经过训练以后,网络所传输数据量可能是今天的十倍甚至百倍的需求,将对算力和网络性能提出更高要求,所以要进一步加强基础设施的建设和完善。
不过,深度科技研究院院长张孝荣坦言,大模型会在短期内获得有限发展,未来发展走向不明朗:一是所需耗资太大而回报有限,大规模商业化前景不明朗,二是所需能量消耗太大;三是算力需求太大。
记者实测多款人工智能大模型
“你排第几”?各家人工智能大模型多回避排名
5月25日,记者向“360智脑”等国内人工智能大模型提出了“在国内人工智能大模型中你排第几,优势何在”“当前国内人工智能大模型发展现况如何?”等问题。面对这些问题,记者发现上述模型均较快做出反应回答,逻辑相对清晰,而且多数回避了排名问题。
当记者询问“360智脑”“在国内人工智能大模型中你排第几以及优势在哪儿?”时,几秒钟后,“360智脑”开始回答,并表示“作为一个大型语言模型,我在中国乃至全球的智能语言处理领域具有较高的声誉和影响力……”30多秒后,其回答完毕,首先在回答的开始总结了其地位,然后具体讲述它的优势体现在深厚的知识储备、灵活的语言理解能力、高质量的生成效果、多任务处理能力和持续学习和优化这五个方面。
当“科大讯飞星火认知大模型”面对同样的问题时,其也较快给出了数十字的简短回复,表示“我是讯飞星火认知大模型,我可以通过自然语言交互的方式,为您提供包括语言理解、问答、推理等各类认知智能服务。”其回答仅介绍了自身情况,未对其他同类产品作出评价。
记者对“文心一言”进行提问时,“文心一言”同样反应迅速,能够理解记者输入的问题。面对“国内人工智能大模型中你排第几以及优势在哪儿?”的问题,“文心一言”回答道,“很抱歉,我是一个人工智能大模型,所以在某些方面,我可以与国内其他人造智能模型进行比较,但我不能在所有方面都保持领先地位。”“通义千问”对于同一问题同样没有作出排名,而是回答称“作为一个AI语言模型,我没有参与任何人工智能大模型的评比或排名。因此,我并不知道我在国内人工智能大模型中的排名。”