中国将出台建设全国一体化数据市场文件-金帆集团

新闻中心

　　今年3月，中国日均词元（Token）调用量超过了140万亿，相比2024年初的1000亿增长了1000多倍，相比2025年底的100万亿，三个月时间又增长了40%多。

　　国家数据局局长刘烈宏24日在国新办发布会上发布了上述数据。词元是大模型处理信息的最小信息单元，具有智能时代可计量、可定价、可交易的特征。当下，围绕词元的调用、分发与结算，一套新的价值体系正在加速演进形成，并成为人工智能产业商业化的重要路径。

　　刘烈宏表示，日均Token调用量的大量增加，充分表明中国人工智能发展进入了快速增长阶段，产业竞争力显著增强，也标志着数据集的供给大量增加，数据要素的价值不断释放，数据要素赋能人工智能创新发展进入了良性互动的阶段。

　　数据是智能经济的关键生产要素。今年是“十五五”开局之年，也被国家数据局定为“数据要素价值释放年”。刘烈宏表示，将以更大力度推进数据要素市场化、价值化。加快建立全国统一的数据产权登记制度，抓紧出台建设全国一体化数据市场的政策文件。

　　高质量数据集赋能人工智能发展

　　截止到2025年底，全国已建成的高质量数据集超过10万个，总体量超过了890PB，这相当于中国国家图书馆数字资源总量的310倍左右。

　　“人工智能发展到哪里，我们就把高质量数据集建设到哪里。人工智能+行动到哪里，行业高质量数据集的建设和推广就要到哪里。”刘烈宏说。

　　针对高质量数据集建设“小和散”的问题，国家数据局会同26个部门组织遴选了72家高质量数据集建设链主单位、140个先行先试工作单位和104个典型案例，构建了链主带动、多方参与、联合攻关、共建共享、合作共赢的高质量数据集建设生态，持续推动高质量数据集的建设。

　　为推动数据标注产业发展，国家数据局布局了成都、沈阳、合肥、长沙、海口、保定、大同7个承担数据标注先行先试建设任务的城市，出台了《关于促进数据标注产业高质量发展的实施意见》，遴选出47个数据标注优秀案例，指导举办了7次数据标注的供需对接会。

　　刘烈宏表示，下一步，将持续推进数据赋能人工智能创新发展，协同各方深入实施新一轮的高质量数据集建设行动计划，包括强基扩容、标注攻坚、提质增效、应用赋能、管理服务、价值释放六大专项行动，以场景需求为牵引，加快推进先行先试的工作，打造技术可行、实用便捷、质量保障的AI-Ready（AI就绪度）高质量数据集，实现高质量数据集供给的量质提升。

　　建设全国一体化数据市场

　　国家数据局成立两年多来，探索形成了数据要素市场化配置改革“5+3+1”的工作体系。“5”就是指健全数据基础制度，建设和运营数据基础设施，场景培育和数据融合应用，建设全国一体化数据市场，壮大数据产业；“3”是指夯实数据领域核心技术攻关、数据标准化、数字人才培养3个基础；“1”是指数据赋能人工智能创新发展1个重点。

　　“政策有了，怎么用好是关键。”刘烈宏说，最近正在加大数据产权制度的宣传解读。结合场景，帮助各方明确数据“持有权、使用权、经营权”的具体配置方案，以明晰数据产权，让各类主体敢于供数、放心用数。

　　刘烈宏表示，下一步，将加快建立全国统一的数据产权登记制度，抓紧出台建设全国一体化数据市场的政策文件，一体推进数据基础制度和数据基础设施建设，破解数据安全合规高效流通的“不可能三角”难题，为数据要素价值释放提供有力保障。