
今年3月,中国日均词元(Token)调用量超过了140万亿,相比2024年初的1000亿增长了1000多倍,相比2025年底的100万亿,三个月时间又增长了40%多。
国家数据局局长刘烈宏24日在国新办发布会上发布了上述数据。词元是大模型处理信息的最小信息单元,具有智能时代可计量、可定价、可交易的特征。当下,围绕词元的调用、分发与结算,一套新的价值体系正在加速演进形成,并成为人工智能产业商业化的重要路径。
刘烈宏表示,日均Token调用量的大量增加,充分表明中国人工智能发展进入了快速增长阶段,产业竞争力显著增强,也标志着数据集的供给大量增加,数据要素的价值不断释放,数据要素赋能人工智能创新发展进入了良性互动的阶段。
数据是智能经济的关键生产要素。今年是“十五五”开局之年,也被国家数据局定为“数据要素价值释放年”。刘烈宏表示,将以更大力度推进数据要素市场化、价值化。加快建立全国统一的数据产权登记制度,抓紧出台建设全国一体化数据市场的政策文件。
高质量数据集赋能人工智能发展
截止到2025年底,全国已建成的高质量数据集超过10万个,总体量超过了890PB,这相当于中国国家图书馆数字资源总量的310倍左右。
“人工智能发展到哪里,我们就把高质量数据集建设到哪里。人工智能+行动到哪里,行业高质量数据集的建设和推广就要到哪里。”刘烈宏说。
针对高质量数据集建设“小和散”的问题,国家数据局会同26个部门组织遴选了72家高质量数据集建设链主单位、140个先行先试工作单位和104个典型案例,构建了链主带动、多方参与、联合攻关、共建共享、合作共赢的高质量数据集建设生态,持续推动高质量数据集的建设。
为推动数据标注产业发展,国家数据局布局了成都、沈阳、合肥、长沙、海口、保定、大同7个承担数据标注先行先试建设任务的城市,出台了《关于促进数据标注产业高质量发展的实施意见》,遴选出47个数据标注优秀案例,指导举办了7次数据标注的供需对接会。
刘烈宏表示,下一步,将持续推进数据赋能人工智能创新发展,协同各方深入实施新一轮的高质量数据集建设行动计划,包括强基扩容、标注攻坚、提质增效、应用赋能、管理服务、价值释放六大专项行动,以场景需求为牵引,加快推进先行先试的工作,打造技术可行、实用便捷、质量保障的AI-Ready(AI就绪度)高质量数据集,实现高质量数据集供给的量质提升。
建设全国一体化数据市场
国家数据局成立两年多来,探索形成了数据要素市场化配置改革“5+3+1”的工作体系。“5”就是指健全数据基础制度,建设和运营数据基础设施,场景培育和数据融合应用,建设全国一体化数据市场,壮大数据产业;“3”是指夯实数据领域核心技术攻关、数据标准化、数字人才培养3个基础;“1”是指数据赋能人工智能创新发展1个重点。
“政策有了,怎么用好是关键。”刘烈宏说,最近正在加大数据产权制度的宣传解读。结合场景,帮助各方明确数据“持有权、使用权、经营权”的具体配置方案,以明晰数据产权,让各类主体敢于供数、放心用数。
刘烈宏表示,下一步,将加快建立全国统一的数据产权登记制度,抓紧出台建设全国一体化数据市场的政策文件,一体推进数据基础制度和数据基础设施建设,破解数据安全合规高效流通的“不可能三角”难题,为数据要素价值释放提供有力保障。