文/广州日报全媒体记者方晴
大模型发展将走向何方?如何迎接人工智能发展带来的伦理挑战?昨日下午,在2024年“读懂中国”国际会议(广州)“智能时代的全球创新协作”平行研讨会上, 香港科技大学校董会主席、美国工程院院士沈向洋,清华大学公共管理学院院长、全球可持续发展研究院执行院长朱旭峰,中国国家创新与发展战略研究会副会长吕本富,中国汽车工业协会常务副会长兼秘书长付炳锋等分享了他们的观点,共同探讨人工智能话题。
GPT-5大模型训练受阻于数据不足
在人工智能领域,数据被视为模型的“燃料”,模型需要从这些数据中学习和提取有用信息。
如何理解训练大模型所需要的数据之巨?香港科技大学校董会主席、美国工程院院士沈向洋以人类阅读书籍为例,作了直观的形容。
1T数据约等于500万本书籍,或20万张高清照片,或5000万篇论文。全世界的书加起来,差不多是21T。“比如,一个20岁的人类,在得到比较好的教育的情况下,累计接收到的信息量大概是0.0002T,差不多就是1000本书。”
大约三年前,GPT-3刚推出时,大模型使用的数据量已达2T,相当于2万亿字节。GPT-4推出来时,训练这款大模型用到的数据量大概为20T。“20万亿字节是什么概念?相当于今天互联网发展40年以来,上面所有可用数据的总和。”
沈向洋表示,之前作为互联网最核心的积累,数据大多被谷歌用来做搜索引擎,以后这些数据都会被拿来训练大模型。“互联网发展40年积累的数据,好像就是为了这样一个AI时刻”。
“过去这两年,大家都非常努力地推出GPT-5。然而,GPT-5至今未能面世,很大一个原因就是数据缺乏。”沈向洋判断,要真正做出像GPT-5这样了不起的新一代系统,可能需要200万亿字节即200T的数据量。所以,未来要做GPT-5,除了现有的数据,还要更多的多模态数据,甚至人工合成的数据。
中国成全球汽车智能技术“试验田”
诚如沈向洋所言,越来越多的垂直行业将目光投向人工智能。在同一场论坛上,中国汽车工业协会常务副会长兼秘书长付炳锋表示,智能化的未来使汽车行业更加坚定地发展自动驾驶技术。“目前搭载L2、L3级的自动驾驶功能新车不断上市,多地也实现了自动驾驶车辆的常态化载人、载物的测试,广大消费者也都习惯于使用辅助驾驶功能。对自动驾驶,中国的消费者也很有期待,从现在的趋势看,完全有理由相信中国将成为自动驾驶研发、推广应用的一片热土。”
与此同时,“车路云一体化”融合发展方案也正在加速落地,城市与智能网联汽车协同发展的试点工作也在全国范围内稳步推进,为智能网联汽车生态构建了丰富的场景和强有力的支撑。作为全球汽车产业的“试验田”,中国智能化升级和绿色低碳转型的实践经验正在为全球汽车行业提供重要参考。
付炳锋介绍,中国汽车行业正通过不断创新,推动算力芯片、操作系统等领域的研发,加快市场培育,新一代信息技术将在中国取得广泛的应用和快速的发展。
当前,中国正积极倡导和共同探索智能网联汽车互利共赢的全球创新合作新模式,通过建立跨国界的合作机制,强化资源共享和优势互补,致力于与各国携手推动技术进步,共同解决好自动驾驶安全、数据隐私保护、跨境监管、协调等全球化面临的挑战。“中国将继续坚定开放合作的态度,推动构建面向未来的全球智能网联汽车生态圈。”他说。
要考虑把人工智能“关进笼子里”
“人工智能发展可能面临5个方面的挑战,3个是内部性挑战,2个是外部性挑战,我们叫作‘3+2’。”中国国家创新与发展战略研究会副会长吕本富提出以上观点。
3个内部性挑战,其一是智能科技会不会放大原来已有的偏见;其二是智能科技会不会产生“机器幻觉”,反而形成深度伪造;其三是如果人工智能未来超过人类怎么办,人工智能的“价值观”如何和人类价值观对齐,怎么把人工智能“关在笼子里”。
外部性挑战有两个,其一是人工智能是否“财富中性”。他强调,新的技术即便不能缩短贫富差距,至少也要保持原状,这称作“财富中性”。其二是就业的问题,是不是“就业中性”。“就像电子商务极大影响了售货员这个职业,但是产生了外卖员这个新职业。现在的人工智能技术是不是也能‘关一扇门,打开一扇窗’?”
吕本富强调,这不是一个国家、一个行业能面对的挑战,而需要国际社会来统一考虑,所以智能时代的全球创新协作很重要。
个人要掌握时代变革的机会
很多人担心在人工智能时代会失去工作、被社会淘汰。对此,清华大学公共管理学院院长、全球可持续发展研究院执行院长朱旭峰建议,对国家来说,应该完善新型举国体制,发挥好政府作用,也发挥好企业作用,让人才、资金等要素向企业汇聚。对个人来说,一定要掌握时代变革的机会,学习好新技术,赋能自己。
“历史上每一次技术革命都是对全体人类造福的,而不是放大国家之间和人群之间的财富分化。所以我们期待各个国家投入力量去开发新技术,让人类迎来新阶段更高级的文明。”他在最后说。