当前位置:首页 > 智能硬件 > 智能硬件
[导读]大约五年前,在机器学习实现了突破之后,科技公司开始严重依赖从成堆数据中学习的软件。最近,研究人员开始向世人揭露机器学习的冷酷无情。去年夏天,来自波士顿大学和微软的研究人员表示,根据谷歌新闻进行学习的软件再现了人类的性别偏见。

去年秋天,弗吉尼亚大学计算机科学专业的教授文森特·欧多尼兹注意到,他所设计的图像识别软件出现了一些猜想模式。当软件识别一张厨房照片时,往往会将其和女性联系起来而非男性。这让欧多尼兹怀疑,自己和其他研究人员是否无意识地在他们的软件中掺进了偏见。因此,他与同事合作,测试了两大组用于训练图像识别软件的图片集。结果令人深思。在烹饪和体育活动方面,微软和 Facebook 所收集的照片反映出了明显的偏见。例如,购物和洗涤的图像与女性相关,而训练和射击的图像则与男性相关。

采用数据集进行训练的机器学习软件非但反映了这些偏见,更是放大了偏见。如果用来学习的图片集都将妇女与烹饪关联在一起,那么软件通过学习则会强化这种联系。人工智能研究所的研究员马克·雅斯卡表示,这种现象也会放大数据中的其他偏见,例如种族偏见。雅斯卡曾经在华盛顿大学与欧多尼兹和其他人共事过,他表示,“这不但会加重现有的社会偏见,甚至会让偏见恶化下去。”

大量复杂的机器学习程序不断出现,这种偏见也日益凸显起来。在研究人员的测试中,身处厨房的人更可能被贴上“女性”标签,而不能反映出实际的学习结果。在研究人员的一篇论文中,一位身处炉子旁的男性则被判定为“女性”。如果这些判定方法进入到科技公司中,很可能会影响到照片存储服务和家庭助手,比如亚马逊的摄像头或是使用社交媒体照片来辨别消费者偏好的工具。2015年,谷歌偶然展示了不当图像软件的危险性,当时,它的照片服务竟将黑人判定为大猩猩。

人工智能系统正承担起越加复杂的任务,风险也越发地不可估量。雅斯卡描述了这样一个场景,当机器人无法确定某人在厨房里做什么时,它会递给男性一杯啤酒,而帮助女性洗盘子。他表示:“如果一个系统的行为能通过性别明确划分,这个系统就无法有效地发挥其效用。”

大约五年前,在机器学习实现了突破之后,科技公司开始严重依赖从成堆数据中学习的软件。最近,研究人员开始向世人揭露机器学习的冷酷无情。去年夏天,来自波士顿大学和微软的研究人员表示,根据谷歌新闻进行学习的软件再现了人类的性别偏见。当对软件进行提问,“男性是程序员那么女性是?”它的回答是“家庭主妇”。新的研究表明,性别偏见根植于两组图片集中,而这原本是用来帮助软件更好地理解图像内容。研究人员观察了华盛顿大学的 ImSitu 和微软的 COCO,每个图片集都包含了 10 万多个来自网络的复杂场景,并配有说明。

两个数据集所包含的男性图像都要多于女性的,而不同性别对应的事物、活动则反映了研究人员所说的显著的性别偏见。在 COCO 中,勺子和叉子等厨房物品都与女性高度相关,而类似滑雪板和网球拍等户外运动设备则更多地与男性相关。当图像识别软件通过这些数据集进行训练时,这种偏差就会放大。COCO 数据集训练出来的系统可能会把鼠标、键盘和男性更为紧密地联系在一起。研究人员设计了一种方法来抵消这种偏见放大现象,即有效使软件反映其学习数据。但它首先要求研究人员找出偏见所在,并明确指出需要修改的内容。修正后的软件仍然会反映原始数据中的性别偏见。

微软研究部主任埃里克·霍维茨说,他希望其他人采用这种方式,因为他们是通过机器学习来设计软件的。公司内部有一个道德委员会,该委员会致力于保持人工智能在公司产品线中的协调性。霍维茨表示: “我和微软作为一个整体,非常希望能够找到同时解决在数据集和系统中产生的偏见和差距。”借用 COCO 和其他数据集的研究人员和工程师们,应该从自己的工作和其他方面寻找偏见产生的迹象。不要从面向儿童的计算机、书籍和其他教育材料中寻找,因为这部分内容往往都被调整过,所呈现的是一个男女均等的理想化世界。霍维茨认为,在某些情况下,可以用类似的方法来训练软件。

其他在机器学习中产生的偏见并不显著。普林斯顿大学的研究员艾琳·卡利斯坎表示,如果男性建筑工人更多,图像识别程序也应该学习到一点。之后,可以采取相应方法来衡量和调整偏见。她说:“为了避免偏见,我们正冒着失去基本信息的风险,数据集需要反映出世界上真实的统计数据。”在这个领域有一项共识,那就是使用机器学习来解决问题比许多人想象的要复杂得多。犹他州大学教授苏雷什·文卡塔萨布拉曼尼亚说:“有人认为算法可以解决一切问题,而纠正偏见同时也可以纠正这种错觉。”

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

业界应如何看待边缘人工智能?ST授权合作伙伴 MathWorks 公司的合作伙伴团队与ST 共同讨论了对边缘机器学习的看法,并与 STM32 社区分享了他们的设计经验。

关键字: AI 机器学习 处理器

双方的合作促成了尖端人工智能视觉解决方案,提高了效率、连通性和成本效益

关键字: 人工智能 智能家居 机器学习

【2024年4月24日,德国慕尼黑讯】英飞凌科技股份公司(FSE代码:IFX / OTCQX代码:IFNNY)发布全新PSOC™ Edge微控制器(MCU)系列的详细信息,该系列产品的设计针对机器学习(ML)应用进行了优...

关键字: 物联网 机器学习 MCU

TDK株式会社(东京证券交易所代码:6762)新近推出InvenSense SmartEdgeMLTM解决方案,这是一种先进的边缘机器学习解决方案,为用户提供了在可穿戴设备、可听戴设备、增强现实眼镜、物联网 (IoT)...

关键字: 机器学习 物联网 传感器

北京——2024年4月19日 亚马逊云科技宣布,Meta刚刚发布的两款Llama 3基础模型Llama 3 8B和Llama 3 70B现已在Amazon SageMaker JumpStart中提供。这两款模型是一系列...

关键字: 机器学习 基础模型

2024年4月18日 – 提供超丰富半导体和电子元器件™的业界知名新品引入 (NPI) 代理商贸泽电子 (Mouser Electronics) 很荣幸地宣布与Edge Impulse建立新的全球合作关系。Edge Im...

关键字: 机器学习 MCU CPU

北京——2024年4月18日 西门子中国和亚马逊云科技双方高层在西门子中国北京总部会晤,双方宣布签署战略合作协议,共同成立“联合创新团队”。基于亚马逊云科技在生成式AI领域的领先技术和服务,并结合西门子在工业领域的深厚积...

关键字: 生成式AI 机器学习 大数据

作为下一代安全、可扩展的零知识(ZK)证明基础架构开创者,Polyhedra Network(简称“Polyhedra”)已与Google Cloud达成合作,共同应对 Web3和Web2环境中对ZK技术不断增长的需求。...

关键字: AI 机器学习

机器学习作为人工智能领域的重要组成部分,其过程涉及到多个核心环节。本文将详细阐述机器学习的四个主要步骤:数据准备、模型选择、模型训练与评估,以及模型部署与应用,以揭示机器学习从数据到应用的完整流程。

关键字: 数据 人工智能 机器学习

随着信息技术的迅猛发展和大数据时代的到来,机器学习成为了人工智能领域中的核心技术之一。机器学习是通过模拟人类学习行为,使计算机系统能够从数据中自动发现规律、提取特征并进行预测和决策的过程。它在诸多领域取得了广泛的应用,包...

关键字: 计算机 人工智能 机器学习
关闭
关闭