点击右上角微信好友

朋友圈

请使用浏览器分享功能进行分享

正在阅读:人工智能时代如何维护文化主体性
首页> 理论频道> 文史科教 > 正文

人工智能时代如何维护文化主体性

来源:学习时报2025-05-31 09:58

  作者:张宜春(中国艺术科技研究所数字艺术部主任)

  当前,以大语言模型技术为核心的人工智能技术正飞速迭代和加速演进。大模型通过海量数据的预训练,形成千亿级别参数的复杂网络结构,能够实现强大的上下文理解和多模态内容生成能力,并在很大程度上体现出了通用性和推理能力,能够有效解决当前社会生产生活中存在的一些具体问题,提升全社会的生产效率。围绕大模型的广泛应用,正在形成新的科研范式、创新范式、人机协同工作范式,解构了传统的代际知识传承方式和教育方式,催生出新的人类信息和知识获取模式,重塑未来经济生活形态。

  但是,当我们看到人工智能带给人类新纪元曙光的同时,也必须看到当前的大模型在涉及文化判断和价值取向的领域,输出结果仍不尽如人意,存在着与主流认知之间的差异,在一定程度上存在着“胡说”“乱说”“胡写”“乱画”的现象,干扰了人们对社会主流价值观念的认同与判断、对中华优秀传统文化的认知和理解,也对人工智能时代的薪火赓续形成了新的挑战。因此,亟须在积极推进大模型产业应用的前提下多措并举,以社会主义核心价值观为引领,把中华文化主体性融入到大模型的建设和产业应用中,让大模型更具“中国特色、中国风格、中国气派”。

  当前的大模型在涉及文化安全的领域,存在着如下问题和挑战。

  从训练数据角度看,全球互联网中的英文语料占比高达59.8%,中文语料占比仅为1.3%,使得大模型在训练生成时就缺乏丰富的中文知识。比如,ChatGPT训练数据所使用的中文数据占比就不足0.1%。这种数据分布结构性的缺陷导致了大模型在认知中文世界时存在先天不足。与此同时,互联网公开信息来源复杂,存在大量未经认证的虚假和错误信息,“以讹传讹、三人成虎”的现象在互联网中屡见不鲜,并形成了大量基于误导信息的语料。这就导致大模型对于真实信息的识别能力下降,进而影响输出结果的正确性。除此之外,互联网经过近三十年的发展,“数字鸿沟”问题依然存在,数据在地域、领域和人群分布上极其不均衡,“马太效应”严重,互联网是强势地区、活跃领域、活跃人群的发声地,互联网数据无法全面代表全球不同人群的价值观和世界观,扭曲了大模型最终的价值判断和文化取向。

  从大模型本身的技术架构角度来看,大模型存在着极其复杂的网络结构,内部工作机制一直被认为是个黑箱,输出逻辑不可理解,输出结果难以预测,可解释性是目前大模型应用中的重要技术难点。因此,一旦出现大模型针对某些领域的输出异常,难以判断是来自模型内部的技术缺陷,还是来自模型外部的人为操作。难以区分“别有用心”和“无心之举”,也就限制了相应对策和措施的应用。此外,大模型在极力追求通用性和泛化能力时,会过度依赖统计规律,导致非强势文化在内容生成时出现明显失真。

  从外部操作角度看,在大模型的创制过程中,算力成为第一制约要素。但是算法和数据依然对于大模型生成有着直接而重要的作用。模型训练数据的取舍、清洗、标注、质量检测,模型参数的调优、对齐、反馈强化学习、能力评价,都有着大量人类智力活动的主动参与,有着主观能动性的发挥空间。业界常说的“有多少人工,就有多少智能”,对于大模型的应用落地依然有效,那么从业者本身的价值判断和审美取向,也会通过其工作带到大模型中。人的主观能动性也在潜移默化中影响着大模型的输出结果。

  因此,为了应对上述风险和挑战,需要从系统思维的角度,展开以下工作。

  第一,加强人工智能时代广义标准体系建设。总而言之,就是要用“标准来约束过程,用数据集来约束结果”。具体来讲,一是要建立“国家——行业——社会——企业”的多层级标准体系。通过标准的建设,纲举目张,执本末从,将大模型的数据建设、参数调优、能力评估、人员准入等问题,以标准的形式加以约束和指导,将价值判断和意识形态融入到大模型的建设过程中。二是要加快人文社科领域各类权威数据集的建设。权威数据集在大模型时代中的作用,犹如定海神针。有了各个细分领域的权威数据集,就可以要求大模型的输出结果能够和权威数据集“对得上,对得准”,工程技术团队才能展开各类大模型中的校准和对齐技术工作,提纲挈领,牵住大模型的“牛鼻子”,实现人工智能在文化艺术领域的对标和对表。

  第二,加快中文优质语料的建设和开放共享。如果把大模型的训练过程看成是一个嗷嗷待哺的婴孩茁壮成长的过程,那么抚育婴孩成长的乳汁就是高质量语料数据。高质量语料数据已经成为推进大模型建设的核心生产要素,对于大模型文化输出能力的建设来说,可谓“得数据者得天下”。做好高质量语料数据建设,首先需要加大政府投入,加快公立文化艺术相关机构的语料库建设和开放工作,尽快将主流声音、主流意识注入互联网中,同时把语料库的建设、开放、共享程度作为考核相关部门和单位数字化转型和改造的重要指标,从专业性、合规性、安全性、适用性等多个方面进行综合评估。其次需要协同推进数据加工处理的工作载体建设,在产业端推进数据标注的产业发展和集聚,在公共事务端推进建设文化艺术行业数据中心,配合国家文化数字化战略的工作任务,做好文化艺术资源的数据汇交工作,集中力量办成大事。最后是创新语料建设的工作机制,增强社会参与和共创能力。一些地方发放“语料券”的实践表明,该机制可使多模态数据库建设效率提升38%,也为文化艺术领域的语料库建设提供了新的解决思路和办法。

  第三,加快数据标注产业的发展。数据标注是原始数据进行采集、清洗、分类、标记、质量检验的专业数据治理工作。随着大模型预训练数据中多模态数据的日趋增多,数据标注已经成为大模型建设中不可缺少的环节。数据标注的水平不仅直接关系到大模型的能力和输出内容结果,也直接影响到中华文化主体性的融入和价值呈现。由于文化艺术领域数据和资源存在明显的专业性、小众性、倾向性、偏好性等特点,无法完全利用机器完成数据标注工作,极其依赖从业者本身具备良好的文化艺术专业知识基础。首先需要大力推进文化艺术领域的数据标注产业和岗位建设,这既能够有效提升大模型建设质量,也能通过产业发展创造出文化艺术领域新的工作岗位,促进人才培养与产业发展的良性互动。其次要做好文化艺术相关领域数据标注人员的技能联动培训,并建立职业准入标准,制定人员定期培训机制,做到“一手管数据,一手管处理数据的人”,从源头上保障大模型中的中华文化主体性融入。

  第四,加强哲学社会科学在大模型建设中的作用。在人工智能快速发展的当下,哲学社会科学需要构建起适应人工智能时代的底层认知框架,主动引导人工智能的发展方向,建立起人和智能体协作共生的理论边界,弄清楚“哪些是可以做的,哪些是不能做的”,探讨新的知识生产模式和人工智能伦理评估模式,开展“新时代文化治理学”的跨学科研究工作,建立起可量化的人工智能意识形态评价体系,对人工智能的广泛应用构建“压力测试”试验环境,在“人工智能热”中注入冷静的观察和思考。将前瞻思辨的思维主动融入大模型的建设和开发链条中,在模型设计阶段即注入人文价值考量,从而最终引领人机共生的知识新生态、文化新生态。

  第五,建立起全社会共同参与和协同工作的机制。大模型中的文化主体性问题,牵涉社会的方方面面,需要通过全社会不断的、持续的、实时的反馈,不断调整大模型的输出结果,建立起“各界共商、多方参与、实时反馈、宽容创新”的中华文化主体性的建设和维护机制。建立“金字塔型”社会参与模型,基层建立起文化AI志愿者联盟和社团组织,实现全民可参与的人工智能反馈机制,让大模型能够做到“出错即发现,有错即更改”;中层建立起各类行业协会和专业组织,完成人类专业知识向人工智能大模型的灌输和渗透;顶层建立起专家伦理审查和价值判断机制,通过分层赋权形成协同治理闭环。全社会携手相望,运用社会共治筑牢创新发展的防护堤岸,最终形成人机共生的中华文明进化生态,回望千年历史,跨越时代变革,赓续璀璨光芒。

[ 责编:赵宇 ]
阅读剩余全文(

您此时的心情

光明云投
新闻表情排行 /
  • 开心
     
    0
  • 难过
     
    0
  • 点赞
     
    0
  • 飘过
     
    0

视觉焦点

  • 提高粮食生产适应气候变化能力

  • 如何理解货币政策的“适度宽松”

独家策划

推荐阅读
发展数字经济是我国把握新一轮科技革命和产业变革新机遇的战略选择。面对创新涌现、迭代迅速的发展态势,我国积极顺应数字经济发展规律,审时度势调整发展政策。
2025-04-21 09:48
建立粮食产销区省际横向利益补偿机制,关键在于推进科技和改革双轮驱动。其中,改革的核心在于粮食政策创设与制度创新,调动和保护好农民种粮积极性,让农民种粮有奔头,让政府抓粮有动力。
2025-03-26 16:25
在当前中国的发展进程中,新型城镇化和乡村全面振兴是两个至关重要的战略方向。这两大战略的实施,不仅关系到中国现代化进程的推进,也是实现全体人民共同富裕的关键步骤。
2025-03-21 16:18
城市是科研机构、人才、设施等创新要素最为集中的地方;城市自身的高质量发展离不开创新。城市的创新及发展,既需要制定明确的目标,还需要遵循一定的规律和原则。
2025-03-18 09:13
全过程人民民主以聚焦民生的方式促进机会公平、打破利益藩篱,让维护社会正义的机制更加完善,持续性地疏浚社会成员上升发展流动渠道,确保每个个体都拥有人生出彩、梦想成真的机会。
2025-03-03 10:49
契合数字化、智能化的传播格局,适应Z世代拥抱变革、表达活跃、实践奋进的代际特征,以更鲜活的话语、多元的样态实现有效触达,彰显理论的生命力与引领力,是做好新时代理论传播的应有之义。
2025-01-22 11:22
人工智能产业作为国民经济最重要的先导产业、基础产业和战略性产业,正在通过生产要素、生产资料更新、重组,生产关系、生产制度重塑,成为最具潜力、带动力和深刻影响力的新质生产力引航。
2024-12-23 13:29
共建“一带一路”的主要目标之一是通过政策沟通、设施联通、贸易畅通、资金融通、民心相通,实现共建国家的共同发展与繁荣。经过11年的共同努力,一大批标志性项目相继建成并投入运营,为共建国家带来了许多实实在在的利益。
2024-12-16 17:13
经济学在应对气候变化中的角色,应该是在科学决定气候目标的基础上,主要研究如何以成本最小化的方式实现该目标,而不是将经济考虑凌驾于科学之上,由经济学决定温升应该控制到什么程度。
2024-11-26 15:50
数字丝路是我国新时期发展的战略性选择,是构建网络空间命运共同体的新阶段。数字丝路贸易的伟大实践正在使古老的丝路焕发出新的光辉。
2024-10-10 16:04
党的十八大以来,我国国际关系学科建设显著加强,发展目标、主要任务、建设路径都更加明确,要求更加清晰,学科建设明显提速,突出体现在学术创新、实践支撑、人才培养等方面。
2024-10-04 10:01
新型城镇化进程的学科建设涵盖了高等教育体系中为适应新型城镇化发展需求而设立的大量相关专业和研究方向,在实践中也是由一个庞大的职业群体共同推进着与中国现代化进程相伴的城镇化进程。
2024-10-03 09:55
新时代中国式现代化的伟大实践,为理论创造提供了强大动力和广阔空间,为建构中国自主的知识体系奠定了坚实基础。
2024-09-19 11:05
随着技术的不断进步和应用的深入,数智化将为经济社会发展全面绿色转型带来更多的机遇和动力,助力中国实现美丽中国建设和“双碳”目标,为全球绿色低碳可持续发展贡献更大力量。
2024-08-15 10:22
网络梗”越来越成为网络空间讲好正能量故事的优良载体。加强“梗能力”建设,是推动党的创新理论高质量传播的重要途径。
2024-08-06 10:17
与“修昔底德陷阱”的预设恰恰相反,构建人类命运共同体遵循共商共建共享原则,推动平等有序的世界多极化和普惠包容的经济全球化向前发展。
2024-08-02 15:08
“碳中和”背景下,有必要将具有高碳汇水平且集中分布的区域纳入生态保护红线范围当中,实施具有规范性和制度化的用途管制策略。
2024-08-01 09:52
数字治理,本质上是数字技术向多元治理主体赋能增效的过程,其目的是在数据收集、分析、利用的基础上,从多个层面对治理系统的感知、决策和执行能力进行提升。
2024-07-10 17:13
在面对错综复杂的国际环境和百年未有之大变局时,我们更需要的是中国特色大国外交的理念,而非吸引眼球的所谓“理论”。
2024-06-21 16:53
面对复杂多变的国际形势,必须用好总体国家安全观这一强大思想武器,自觉运用其方法论原则武装头脑、指导实践,从整体上把握国家安全,不断开创新时代国家安全工作新局面。
2024-06-13 09:36
加载更多