汕头市智能制造产业协会
加入收藏 | 设为首页

内容展示

首页 >

机器会学习,但它会遗忘吗?

2021-10-12


机器会学习,但它会遗忘吗?

有朋友说,“拔了电源不保存不就忘了!”

问题没那么简单。

学会遗忘,AI面临的一大挑战

机器学习的宗旨是使用计算机作为工具并致力于真实、实时的模拟人类学习方式,其可以将现有内容进行知识结构划分,再广泛应用于解决工程应用和科学领域的复杂问题。现在,机器学习被视作最具智能特征的研究领域,但科学家提出了新的问题:机器会学习,但它会遗忘吗?

1.png

连线》网站文章截图

《连线》杂志网站近日刊文称,作为计算机科学中的新兴领域,机器学习研究者们已经 开始探索在AI中诱发“选择性失忆”的方法,其目标是在不影响模型性能的前提下,从机器学习中删除特定人员或点的敏感数据。如果未来能够实现,那么这一概念将帮助人们更好地控制数据。

2.png

视频截图。研究人员测试他们能否在无需“从零开始”重新训练系统的情况下删除敏感数据

学习容易,想要忘记有点儿难

实际上,机器的学习方式虽然在效仿人类,但“遗忘”方式却与我们大不一样。

机器学习的“遗忘”,对于有需求的用户——比如那些对他们在网上分享的内容感到后悔的人来说,其实很直观。但从技术层面来讲, 消除特定数据点影响的传统方法,就是“从零开始”重建系统,这是一项代价可能相当高昂的工作,令企业几乎难以承受。

具体来说,某些地区的用户如果对他们披露的内容改变了主意,其实是有权要求公司删除他们所有数据的。但“彻底抹除”这件事很难实现,因为一旦经过训练,机器学习系统就不会轻易改变,甚至就连训练者们自己也不清楚系统是如何掌握这些能力的——他们并不能完全理解自己调试或训练出的算法。

3.png

图片来源:视觉中国


2019年,有科学家提出可以将机器学习项目的源数据分成多个部分,以实现对单个数据点的“遗忘”,但这一思路最近已被证明存在缺陷——如果提交的删除请求以特定的顺序出现,无论是偶然的还是恶意的,机器学习系统都会崩溃。

选择性失忆,需要全新探索

人们对人工智能系统侵犯个人隐私的担忧日益严重。如何让AI学会“选择性失忆”,从而可以在无需“从零开始”对系统进行再培训的情况下删除敏感数据,成为时下研究的热点问题。它关乎能否可以更好地控制数据和由此获得的价值。而要实现“选择性失忆”这个概念,科学家可能需要在计算机科学方面做出全新探索。

“当他们(用户)要求删除数据时,我们能否消除他们数据的所有影响,同时避免从头开始重新训练的全部成本?”宾夕法尼亚大学机器学习教授亚伦·罗斯表示, 他们目前进行的研究就是希望能找到一些“中间地带”。或许在不久的将来,有望找出一条既可以控制数据也可以保护由数据产生的价值的发展道路。



来源:科技日报