📰 为AI发展提供充足“燃料” 行业高质量数据集建设方案落地

国家数据局近日印发实施方案,提出到2028年底打造一批高质量行业数据集,覆盖重点领域并实现应用验证,形成数据驱动的创新场景、行业企业与人才队伍,并推出相关工具与标准。专家指出,高质量数据集是大模型训练与应用的基石,供给规模与质量决定AI创新高度与产业落地深度。当前数据集虽已超11.6万、总量960PB、日均Token超高,但仍面临分散、质量不一、标准不统一、模型适配不足等问题,制约重点行业与复杂场景的应用。实施方案聚焦六大行动:强基扩容、标注攻坚、提质增效、应用赋能、管理服务与价值释放,构建“数据飞轮”生态,推动数据资源与AI协同发展。各行动强调拓宽供给、推动数据标注专业化、培育标注企业、应用仿真合成以解决稀缺场景,并探索词元交易等新型商业模式,促进数据流通与商业化。业内人士认为,聚焦重点行业与新兴领域(如低空经济、具身智能、智能驾驶、智慧海洋、生物制造等),以多模态、仿真、物理交互数据和高精度标注需求为导向,将带动数据采集、建模、场景测试和模型训练等环节升级,推动形成需求-数据-模型闭环与可复用的标杆案例,提升数据资源产品化与服务化能力,为产业链上下游提供稳定数据供给。

🏷️ #数据集 #AI应用 #数据标注 #行业数据 #数据飞轮

🔗 原文链接
 
 
Back to Top