点击右上角微信好友

朋友圈

请使用浏览器分享功能进行分享

正在阅读:以技术手段破解数据合规难题
首页> 理论频道> 理论综合 > 正文

以技术手段破解数据合规难题

来源:学习时报2023-08-12 10:08

  作者:唐林垚

  数据是新型生产要素,对助推传统产业转型升级、打造新产业新业态新模式、壮大经济发展引擎,都起到重要的作用。根据“十四五”规划纲要,“统筹数据开发利用”“推进数据跨部门、跨层级、跨地区汇聚融合”成为我国数字化转型的顶层设计。在激发要素潜能和隐私保护的双重驱动下,大批在提供隐私保护前提下实现数据价值挖掘的数据处理模式相继涌现,包括多方安全计算、可信执行环境为代表的隐私计算技术,以低代码、零代码为核心的“软件即服务”(SaaS)平台等。

  数据合规从技术层面来说具有多方面优势,体现在以技术手段促进组织形式与价值创造的分离。例如,多方安全计算可在非信任主体间数据相互保密的前提下,进行高效融合计算,实现“数据占有权和使用权的分离”;可信执行环境可通过硬件隔断形成封闭运行环境,兑现更高标准的隐私保护承诺,实现“数据供给和数据保护的分离”;低代码和零代码可为开发者提供可视化应用开发环境,降低或去除应用开发对原生代码编写的需求,实现“算法手段和算法目的分离”。

  数据合规的前沿技术风险

  前端风险在于诱发人机对抗。技术手段下数据合规具有“白盒特性”,各参与方都可以直接获取完整的技术参数,恶意攻击者同样可以利用该特性伪装成诚实参与方窃取运算结果、扭曲模型训练、破解可信环境或生成恶意低代码。参与方自愿提供数据、消耗算力参与数据合规实践,其具有强烈的自利动机,轻则通过参与获得技术使用权,重则掠夺中间数据和源头数据。依据危害性由低到高的顺序,将数据合规的参与方划分成三种类型。此种划分方式表明,随着利益需求的不断变化,各参与方的角色定位也可能发生改变。

  中端风险在于加剧算法歧视。算法歧视主要源于数据集偏差或数据缺陷,在数据合规场景中,不同来源数据间的强搭和错配可能对联合数据造成冲击与扰乱,使算法歧视规模性放大。除了数据投毒等极端手段,诚实但好奇参与方的数据输入因数据梯度同其他参与方相差过大,也可能间接导致模型被“污染”,输出歧视性结果。单次歧视的即时危害虽不易被察觉,却足以在更长时间维度和更长数据链条上产生积累式影响。例如,当不同学校的毕业生数据被用于训练招聘筛选系统,或者当男性占绝对多数的IT行业数据和其他行业数据被共同用于训练升职评价系统时,同身份紧密捆绑的群体歧视将借由算法“共训”之名,从数据向模型蔓延。

  后端风险在于催生逆向淘汰。在各类促进数据合规的技术大规模部署前,面对受众,智能应用被限制在各自为政的领域,彼此之间没有交流与协作,更多的是算法间的良性循环,即效率高、服务好、安全稳定的智能应用将获得更高市场份额,榨取用户剩余的智能应用将面临被淘汰或整改的命运,因严重违法违规收集使用个人信息而被强制下架的各类APP即为典型事例。由于披上了“合规”的外衣,数据合规科技可能逐渐导致“算法趋同”,在技术黑箱的掩护之下,过去算法间的“朝上竞争”极有可能向“逐底竞争”转变。对数据规整性要求不高、通信成本更低、算法可解释性匮乏的智能应用,或将随着技术手段下数据合规的不断发展,逆向淘汰相对保守的传统智能应用。

  破解数据合规的应对措施

  为应对前端风险,应引入声誉概念作为衡量参与方信任度的核心指标。多权重主观逻辑模型使基于声誉的可信赖客户端之间的“朝上竞争”成为可能,配合区块链技术的不可篡改特性,分布式信誉管理将成为现实。例如,主导方可围绕深度强化学习设计激励策略,在开源分布式特殊场景中推行资源“按劳分配”,以达到边缘节点的最佳训练水平;利用区块链技术跟踪全局模型更新,对积极贡献用户给予丰厚奖励,实现局部模型的更高稳定性。此外,契约理论可被用于各参与方算力投入和模型质量的衡量。不过,技术互嵌的解决方案有时也存在相互掣肘,技术方需“量力而行”。例如,区块链技术的公共账本特性存在通信延迟、数据吞吐量大等问题,必然对通信设备、服务器带宽以及主机算力等提出更高要求。为此,可通过对通信成本和模型准确性之间进行表征的多节次方程式对二者的权衡取舍予以指导。

  为应对中端风险,应构建数据清洗过程适用的缺省性数据筛选机制。避免算法歧视“群体化”需要深入数据处理的社会性聚合机制,尤其需拷问作为多方安全计算、联邦学习和低代码参与方的自身禀赋、行业特点和地域限制在何种程度上影响了数据样本的生成。无论如何清洗,来源于同一主体的数据通常会被打上难以察觉的烙印,具有隐性的身份化表征,在无形之中限定了数据合规的应用格局。不同数据间集体身份在数据合规实践中相互排斥和博弈越明显,得出的运算结果、训练出的公共模型和成型的低代码模块就越有可能产生歧视。简言之,原本稀松平常的数据,可能由于同其他非适配数据的联合,导致数据池难以自洽。在数据处理的过程链条上,被污染的数据池无法充分发挥技术潜力,甚至可能造成数据共享机制和自动化决策机制一同组成的整体解决方案的走样。歧视源于数据,因此,主导方应在数据清洗过程中主动去除冗余、不相关、不合格数据,在降低通信成本的同时提升运算精度,避免各参与方因“数据饥渴”而“来者不拒”,以期从源头“掐断”算法歧视群体化的苗头。

  为应对后端风险,应确立智能应用开发和投入市场的基础伦理标准。引导科技向善、避免智能应用出现“劣币驱逐良币”的有效手段,是通过法律将标准和原则植入技术的底层行动逻辑。在投入市场前,任何技术应用都应满足伦理先行原则,不得游走于现有法律体系的灰色地带进行监管套利。因汇聚了海量大数据,技术方极有可能经不住诱惑,利用算法压榨个体,摄取不成比例的回报。伦理先行原则表明,技术目标的选择不应是简单的效益至上或是性能择优。在数据合规场景中,各参与方的效益增长势必会同步拉动社会公共利益的福祉提升。此外,对于数据主体而言理应共享技术红利,技术方必须兑现用户授权时所抱有的信赖利益,否则数据主体有权主张数据处理合同自始无效。(唐林垚)

[ 责编:徐倩阳 ]
阅读剩余全文(

您此时的心情

光明云投
新闻表情排行 /
  • 开心
     
    0
  • 难过
     
    0
  • 点赞
     
    0
  • 飘过
     
    0

视觉焦点

  • 提高粮食生产适应气候变化能力

  • 如何理解货币政策的“适度宽松”

独家策划

推荐阅读
发展数字经济是我国把握新一轮科技革命和产业变革新机遇的战略选择。面对创新涌现、迭代迅速的发展态势,我国积极顺应数字经济发展规律,审时度势调整发展政策。
2025-04-21 09:48
建立粮食产销区省际横向利益补偿机制,关键在于推进科技和改革双轮驱动。其中,改革的核心在于粮食政策创设与制度创新,调动和保护好农民种粮积极性,让农民种粮有奔头,让政府抓粮有动力。
2025-03-26 16:25
在当前中国的发展进程中,新型城镇化和乡村全面振兴是两个至关重要的战略方向。这两大战略的实施,不仅关系到中国现代化进程的推进,也是实现全体人民共同富裕的关键步骤。
2025-03-21 16:18
城市是科研机构、人才、设施等创新要素最为集中的地方;城市自身的高质量发展离不开创新。城市的创新及发展,既需要制定明确的目标,还需要遵循一定的规律和原则。
2025-03-18 09:13
全过程人民民主以聚焦民生的方式促进机会公平、打破利益藩篱,让维护社会正义的机制更加完善,持续性地疏浚社会成员上升发展流动渠道,确保每个个体都拥有人生出彩、梦想成真的机会。
2025-03-03 10:49
契合数字化、智能化的传播格局,适应Z世代拥抱变革、表达活跃、实践奋进的代际特征,以更鲜活的话语、多元的样态实现有效触达,彰显理论的生命力与引领力,是做好新时代理论传播的应有之义。
2025-01-22 11:22
人工智能产业作为国民经济最重要的先导产业、基础产业和战略性产业,正在通过生产要素、生产资料更新、重组,生产关系、生产制度重塑,成为最具潜力、带动力和深刻影响力的新质生产力引航。
2024-12-23 13:29
共建“一带一路”的主要目标之一是通过政策沟通、设施联通、贸易畅通、资金融通、民心相通,实现共建国家的共同发展与繁荣。经过11年的共同努力,一大批标志性项目相继建成并投入运营,为共建国家带来了许多实实在在的利益。
2024-12-16 17:13
经济学在应对气候变化中的角色,应该是在科学决定气候目标的基础上,主要研究如何以成本最小化的方式实现该目标,而不是将经济考虑凌驾于科学之上,由经济学决定温升应该控制到什么程度。
2024-11-26 15:50
数字丝路是我国新时期发展的战略性选择,是构建网络空间命运共同体的新阶段。数字丝路贸易的伟大实践正在使古老的丝路焕发出新的光辉。
2024-10-10 16:04
党的十八大以来,我国国际关系学科建设显著加强,发展目标、主要任务、建设路径都更加明确,要求更加清晰,学科建设明显提速,突出体现在学术创新、实践支撑、人才培养等方面。
2024-10-04 10:01
新型城镇化进程的学科建设涵盖了高等教育体系中为适应新型城镇化发展需求而设立的大量相关专业和研究方向,在实践中也是由一个庞大的职业群体共同推进着与中国现代化进程相伴的城镇化进程。
2024-10-03 09:55
新时代中国式现代化的伟大实践,为理论创造提供了强大动力和广阔空间,为建构中国自主的知识体系奠定了坚实基础。
2024-09-19 11:05
随着技术的不断进步和应用的深入,数智化将为经济社会发展全面绿色转型带来更多的机遇和动力,助力中国实现美丽中国建设和“双碳”目标,为全球绿色低碳可持续发展贡献更大力量。
2024-08-15 10:22
网络梗”越来越成为网络空间讲好正能量故事的优良载体。加强“梗能力”建设,是推动党的创新理论高质量传播的重要途径。
2024-08-06 10:17
与“修昔底德陷阱”的预设恰恰相反,构建人类命运共同体遵循共商共建共享原则,推动平等有序的世界多极化和普惠包容的经济全球化向前发展。
2024-08-02 15:08
“碳中和”背景下,有必要将具有高碳汇水平且集中分布的区域纳入生态保护红线范围当中,实施具有规范性和制度化的用途管制策略。
2024-08-01 09:52
数字治理,本质上是数字技术向多元治理主体赋能增效的过程,其目的是在数据收集、分析、利用的基础上,从多个层面对治理系统的感知、决策和执行能力进行提升。
2024-07-10 17:13
在面对错综复杂的国际环境和百年未有之大变局时,我们更需要的是中国特色大国外交的理念,而非吸引眼球的所谓“理论”。
2024-06-21 16:53
面对复杂多变的国际形势,必须用好总体国家安全观这一强大思想武器,自觉运用其方法论原则武装头脑、指导实践,从整体上把握国家安全,不断开创新时代国家安全工作新局面。
2024-06-13 09:36
加载更多