点击右上角微信好友

朋友圈

请使用浏览器分享功能进行分享

正在阅读:加快建设人工智能高质量数据集
首页> 理论频道> 文史科教 > 正文

加快建设人工智能高质量数据集

来源:科技日报2025-02-10 10:12

  作者:王晓明(中国科学院科技战略咨询研究院研究员)

  当前,人工智能处在快速发展的关键时期,正在重塑经济社会发展模式。2024年中央经济工作会议指出,开展“人工智能+”行动,培育未来产业。数据作为人工智能发展的三大核心要素之一,是人工智能模型训练的基础要素,也是人工智能模型应用的核心资源,加快建设人工智能高质量数据集,对于推动“人工智能+”场景落地具有重要意义。

  高质量数据集建设存在的问题

  高质量数据供给是推动新一代人工智能加快发展的关键要素。当前,面向新一代人工智能的数据供给仍有不足,数据处理专用技术有待进一步突破,数据产业和数据生态有待丰富,高质量数据集的整体规划和支持政策还有待完善。

  首先,通用领域、垂直领域以及具身智能领域的高质量数据供给仍有不足。一方面,中文公开数据在质量和数量方面落后于英文数据。另一方面,我国公共数据开放利用程度有待提高,各地开放标准不统一,专门面向人工智能发展的高质量行业数据集仍较匮乏。具身智能领域真实交互数据采集不足,主要原因在于智能机器人与环境的交互数据获取困难且成本高昂,同时,企业采集数据缺乏统一的参照标准。

  其次,高质量数据的合成、处理和利用技术亟待提升。利用深度学习和强化学习生成高精确度、多样化合成数据的技术在成熟度和应用范围上急需突破。随着社会自动化和智能化程度的不断提高,对数据处理的要求也不断提升,因此急需针对结构化、半结构化和非结构化数据的处理技术进行迭代优化,进一步提高数据处理效率。

  再次,数据主体和商业模式发展尚不成熟。我国缺乏类似美国Databricks和Snowflake“数据+人工智能”模式的高质量数据汇聚和治理主体,具备大规模数据汇聚管理分析能力的公司数量不足。医疗、法律、保险、金融、工业、科研等多个领域的公共数据授权运营主体目前仍在培育中,数据集构建和运营利用的商业模式发展还不够成熟。

  最后,高质量数据集的专项规划和支持政策有待完善。我国已出台一系列数据发展相关指引政策,但是面向新一代人工智能模型训练和场景应用的高质量数据集专项规划和支持政策尚未出台,其建设、运营、流通、利用等方面举措有待进一步细化。在数据采集方面,各领域数据缺乏适用的标准规范;在数据使用方面,缺少面向大模型和具身智能模型训练的数据共享和流通促进机制,一定程度上限制了模型能力的快速提升。

  多措并举建设高质量数据集

  针对当前存在的资源、技术、模式、制度等方面问题,结合新一代人工智能发展的需要,建议发挥政府和市场的协同作用,多措并举推进高质量数据集建设。

  一是加快公共数据开放和企业数据流通,建设面向新一代人工智能的高质量数据集。建议形成部门、行业、地区共同参与的协同机制,围绕高质量数据集建设,扩大数据供给范围和规模,完善公共及行业数据标准,加速可信数据空间建设。面向医疗、教育、科研、法律、工业、农业、物流、金融、能源、交通等重点领域建设大数据中心及大模型行业应用创新(工程)中心,打破信息孤岛,构建完备数据生态,构建高质量数据集,提升垂直领域人工智能模型能力。着眼自动驾驶、具身智能等未来产业需求,开放相关公共数据,制定行业数据标准,探索企业间数据流通机制,鼓励企业和研究机构创建高质量行业数据集。

  二是围绕建设行业高质量数据集关键技术问题加大攻关力度。面向数据合成和处理,加快开发数据合成、数据治理的关键共性技术;面向数据流通汇聚,大力推广隐私计算、区块链等技术;面向“数据+人工智能”应用模式,着力开发数据管理技术,探索新型模型结构和训练架构。鼓励面向人工智能的数据产品、数据服务企业牵头承担国家重大项目,开展应用基础研究和关键核心技术攻关。推动产学研合作和创新联合体建设,打造数据技术、产品和服务深度融合的新型合作模式。面向重点场景,打造数据技术“测试场”,提供真实数据环境、模拟应用场景,建设中试基地,吸引企业、高校和科研机构参与数据技术的创新和验证,加速新技术推广和应用。

  三是引导企业和商业模式创新,构建人工智能数据产业生态。大力培育人工智能数据资源、技术、服务、应用、安全、基础设施等多领域企业,重点建设面向人工智能行业的数据产业创新平台。鼓励企业基于“数据+人工智能”探索多领域商业模式,支持企业与各方合作,打造基于高质量数据集的产业创新链和生态系统。鼓励企业探索大模型和具身智能应用场景,驱动数据产业发展。支持模型应用、模型开发、数据服务、数据产品等相关企业组建创新联合体,开发高质量数据集,发展“数据即服务”“知识即服务”“模型即服务”等新业态。

  四是加大人工智能高质量数据集建设政策支持力度。面向新一代人工智能技术开发和应用发展需求,完善数据资源构建体系,培育数据产业,支持数据技术发展,系统推进高质量数据集建设,强化行业应用。统筹中央和地方财政资金、产业引导基金和各类政策性投资,加大对高质量数据集建设的投入。鼓励金融机构创新产品和服务,增加对数据相关企业的融资支持。引导社会资本有序参与人工智能高质量数据集的开发利用。

[ 责编:赵宇 ]
阅读剩余全文(

您此时的心情

光明云投
新闻表情排行 /
  • 开心
     
    0
  • 难过
     
    0
  • 点赞
     
    0
  • 飘过
     
    0

视觉焦点

  • 《自信之源》:寻古问今 简而意足

  • 四重叙事的思政课

独家策划

推荐阅读
全过程人民民主以聚焦民生的方式促进机会公平、打破利益藩篱,让维护社会正义的机制更加完善,持续性地疏浚社会成员上升发展流动渠道,确保每个个体都拥有人生出彩、梦想成真的机会。
2025-03-03 10:49
契合数字化、智能化的传播格局,适应Z世代拥抱变革、表达活跃、实践奋进的代际特征,以更鲜活的话语、多元的样态实现有效触达,彰显理论的生命力与引领力,是做好新时代理论传播的应有之义。
2025-01-22 11:22
人工智能产业作为国民经济最重要的先导产业、基础产业和战略性产业,正在通过生产要素、生产资料更新、重组,生产关系、生产制度重塑,成为最具潜力、带动力和深刻影响力的新质生产力引航。
2024-12-23 13:29
共建“一带一路”的主要目标之一是通过政策沟通、设施联通、贸易畅通、资金融通、民心相通,实现共建国家的共同发展与繁荣。经过11年的共同努力,一大批标志性项目相继建成并投入运营,为共建国家带来了许多实实在在的利益。
2024-12-16 17:13
经济学在应对气候变化中的角色,应该是在科学决定气候目标的基础上,主要研究如何以成本最小化的方式实现该目标,而不是将经济考虑凌驾于科学之上,由经济学决定温升应该控制到什么程度。
2024-11-26 15:50
数字丝路是我国新时期发展的战略性选择,是构建网络空间命运共同体的新阶段。数字丝路贸易的伟大实践正在使古老的丝路焕发出新的光辉。
2024-10-10 16:04
党的十八大以来,我国国际关系学科建设显著加强,发展目标、主要任务、建设路径都更加明确,要求更加清晰,学科建设明显提速,突出体现在学术创新、实践支撑、人才培养等方面。
2024-10-04 10:01
新型城镇化进程的学科建设涵盖了高等教育体系中为适应新型城镇化发展需求而设立的大量相关专业和研究方向,在实践中也是由一个庞大的职业群体共同推进着与中国现代化进程相伴的城镇化进程。
2024-10-03 09:55
新时代中国式现代化的伟大实践,为理论创造提供了强大动力和广阔空间,为建构中国自主的知识体系奠定了坚实基础。
2024-09-19 11:05
随着技术的不断进步和应用的深入,数智化将为经济社会发展全面绿色转型带来更多的机遇和动力,助力中国实现美丽中国建设和“双碳”目标,为全球绿色低碳可持续发展贡献更大力量。
2024-08-15 10:22
网络梗”越来越成为网络空间讲好正能量故事的优良载体。加强“梗能力”建设,是推动党的创新理论高质量传播的重要途径。
2024-08-06 10:17
与“修昔底德陷阱”的预设恰恰相反,构建人类命运共同体遵循共商共建共享原则,推动平等有序的世界多极化和普惠包容的经济全球化向前发展。
2024-08-02 15:08
“碳中和”背景下,有必要将具有高碳汇水平且集中分布的区域纳入生态保护红线范围当中,实施具有规范性和制度化的用途管制策略。
2024-08-01 09:52
数字治理,本质上是数字技术向多元治理主体赋能增效的过程,其目的是在数据收集、分析、利用的基础上,从多个层面对治理系统的感知、决策和执行能力进行提升。
2024-07-10 17:13
在面对错综复杂的国际环境和百年未有之大变局时,我们更需要的是中国特色大国外交的理念,而非吸引眼球的所谓“理论”。
2024-06-21 16:53
面对复杂多变的国际形势,必须用好总体国家安全观这一强大思想武器,自觉运用其方法论原则武装头脑、指导实践,从整体上把握国家安全,不断开创新时代国家安全工作新局面。
2024-06-13 09:36
数字基础设施是数字经济发展的底座,是网络强国、数字中国建设的基石。要立足不同产业特点和差异化需求,推动经济产业全方位、全链条网络化、数字化、智能化转型。
2024-04-23 16:17
高质量构建“大思政课”工作体系要聚焦目标、效果和特色,着力破解思政课建设中的重点、难点和关键问题,带动思政课叙事表达体系和场景体验模式的深层变革。
2024-03-18 10:28
中华文化的主体性植根于5000多年的文化沃土,是在创造性转化、创新性发展中华优秀传统文化、传承革命文化、发展社会主义先进文化的基础上,借鉴吸收人类一切优秀文明成果的基础上建立起来的。
2024-03-08 16:31
数字化网络化智能化加速发展,各国既面临着新的发展机遇,也需要应对新的全球性问题,国际社会迫切需要携手合作,共同打造和平、安全、开放、合作的网络空间,携手构建网络空间命运共同体。
2024-03-01 14:51
加载更多