广州日报讯 (全媒体记者刘畅 通讯员方应彬)记者近日获悉,作为全国数据要素流通的核心枢纽,深圳数据交易所(以下简称“深数所”)积极响应政策部署,围绕“构建行业语料集”与“探索数据跨境流动”两大核心任务,全面赋能人工智能产业创新。
构建行业语料集 探索数据跨境流动
近期出台的《深圳市加快打造人工智能先锋城市行动计划(2025—2026年)》(以下简称《行动计划》)明确提出“汇聚建成3PB中文语料数据”的目标。深数所依托深圳丰富的产业生态,率先成立“开放算料联盟”,联合46家数据商发布超过1100个高质量训练数据集,覆盖医疗、教育、交通、金融等12个重点领域。这些数据集不仅包含文本、图像、音频等传统模态,更涵盖自动驾驶仿真场景、全球宏观产业链图谱等前沿领域,为垂直行业大模型训练提供精准支撑。
在推动数据共享与交易方面,深数所创新推出“语料券”激励机制,成功落地全国首单语言语料场内交易、首笔多模态算料集交易闭环,帮助企业实现数据资产估值超2亿元。同时,深数所联合华大基因、瑞莱智慧等机构试点建设医疗行业可信数据空间,通过技术手段保障数据安全流通,助力AI辅助诊断、生物医药研发等场景加速落地。
深圳毗邻港澳的区位优势为数据跨境流动提供了天然条件。深数所积极响应政策号召,建设跨境数据交易专区,引入香港中易科技跨境电商数据集、Criat金融时序数据等数据资源,服务大湾区企业全球化布局。目前,跨境专区已上线超200个跨境数据产品,涵盖跨境电商、供应链金融等场景,助力企业高效获取国际数据资源。
为破解跨境数据流动的合规难题,深数所联合市委网信办、前海管理局等机构,试点制定重点领域数据跨境负面清单,并推出跨境数据合规评估、撮合交易一站式服务。例如,针对医疗数据跨境需求,深数所开发了基于区块链的隐私计算技术,确保数据“可用不可见”,为粤港澳大湾区产学研协同创新提供安全底座。
筑牢数据安全基座,聚焦三大方向持续发力
人工智能的蓬勃发展离不开安全可信的数据环境。深数所首创“法治+信用”动态合规体系,发布全国首个《生成式人工智能服务交易合规评估指引》,覆盖500余项风险识别点,从数据采集、标注到交易全流程保障合法合规。同时,深数所自主研发AIGC合规服务系统,集成法律知识图谱与大模型技术,为企业提供智能风险预警、合规答疑等支持,累计服务超1000家AI相关企业。
在技术层面,深数所联合国家高端智库,搭建数据跨境流动安全实验室,攻关联邦学习、多方安全计算等核心技术,已在自动驾驶、智慧医疗等领域实现商业化应用。例如,通过可信数据空间技术,深数所协助哈尔滨工业大学(深圳)与瑞莱智慧完成医疗语料安全交易,推动AI诊断模型研发效率提升40%。
未来,深数所将聚焦三大方向持续发力:打造国家级数据交易所标杆,进一步扩容开放算料联盟,不断开发高价值数据集,通过发放“语料券”不断激活交易生态;建设国际数据流通枢纽,深化与前海、河套片区合作,批量上市跨境数据产品,探索“一带一路”数字贸易合作,助力深圳成为全球数据要素配置中心;培育“数据×AI”新质生产力,推动数据要素与智能制造、智慧城市深度融合,孵化更多的“人工智能+”创新应用,为深圳高质量发展注入新动能。