当前位置:首页 > 智能硬件 > 人工智能AI
[导读] 机器学习是当今技术最重要的基本趋势之一,也是未来十年科技将在更广阔的世界中改变事物的主要方式之一。作为其中的一部分,机器学习的各个方面引起关注 - 例如,它对就业的潜在影响,以及它用于我们可能认

机器学习是当今技术最重要的基本趋势之一,也是未来十年科技将在更广阔的世界中改变事物的主要方式之一。作为其中的一部分,机器学习的各个方面引起关注 - 例如,它对就业的潜在影响,以及它用于我们可能认为不道德的目的,例如它可能给予压迫性政府的新能力。另一个,也就是这篇文章的主题,是人工智能偏差的问题。

什么是'AI Bias偏差'?

“原始数据既是矛盾又是坏主意; 相反,数据应该小心烹饪。“杰弗里鲍克

直到2013年左右,如果你想制作一个可以识别照片中的猫的软件系统,你就会编写逻辑步骤。你会做一些寻找图像边缘的东西,一个眼睛探测器,一个用于皮毛的纹理分析器,并尝试计算腿部等等,然后将它们全部固定在一起......它永远不会真的很棒。从概念上讲,这就像试图制造机械马一样 - 理论上这是可能的,但在实践中,复杂性太大,我们无法描述。在没有工作模型的情况下,您最终会得到数百或数千条手写规则。

通过机器学习,我们不使用手写规则来识别X或Y。

相反,我们采用X的一千个例子和Y的一千个例子,我们让计算机根据这些的统计分析建立一个模型。例子。然后我们可以给该模型一个新的数据点,并且它具有给定的准确度,是否适合示例集X或示例集Y.机器学习使用数据生成模型,而不是人类编写模型。这产生了惊人的好结果,特别是对于识别或模式发现问题,这就是为什么整个科技行业正在围绕机器学习重新制作的原因。

然而,有一个问题。在现实世界中,你的千(或十万或百万)X和Y的例子也包含A,B,J,L,O,R和P.这些可能不均匀分布,并且它们可能足够突出,你的AI系统对L和R的关注度却超过了X。

这在实践中意味着什么?我最喜欢的例子是图像识别系统倾向于观看草山的照片并指出“羊”。大多数作为“绵羊”的例子的照片都是在草山上拍摄的,因为那是绵羊往往生活的地方,而且图像中的草比白色蓬松的小东西更加突出。

这里要理解的一个重要事项是系统没有语义去理解它正在看的是什么。我们查看像素网格并将其转换为绵羊,皮肤或标尺,系统只看到一串数字。它没有看到3D空间,物体,纹理或绵羊。它只是看到数据中的模式。

同时,尝试诊断此类问题的挑战在于您的机器学习系统生成的模型(神经网络)包含数千或数十万个节点。没有简单的方法来查看模型内部,看看它是如何做出决定的 - 如果可以的话,那么这个过程很简单,你首先就不需要ML了,你可以自己编写规则。人们担心ML是一个“黑匣子”。(正如我稍后解释的那样,这个问题经常被夸大了。)

那么什么是“AI偏差”或“机器学习偏差”问题?用于查找数据模式的系统可能会找到错误的模式,您可能也没有意识到。

AI偏差场景用例

这个问题可以表现出来的最明显和最直接的关注点是人类的多样性。据报道,亚马逊最近曾尝试建立一个机器学习系统来筛选简历以进行招聘。由于亚马逊目前的员工群体偏向于男性,因此“成功招聘”的例子在机械上也会使男性产生偏差,因此,该系统选择了简历。亚马逊发现了这一点,该系统从未投入生产。

这个例子中最重要的部分是据报道,即使在简历上没有明确标明性别,该系统也表现出这种倾斜。该系统在其他事物中看到了“成功员工”样本集中的模式 - 例如,女性可能会使用不同的词语来描述成就,或者在学校中进行过不同的体育运动。当然,该系统不知道什么是冰球,也不知道人们是什么,也不知道“成功”是什么 - 它只是对文本进行统计分析。但是它所看到的模式并不一定是人类会注意到的东西。

它变得更糟。一个非常善于发现苍白皮肤上的皮肤癌的机器学习系统可能更难以在深色皮肤上发现皮肤癌,反之亦然,可能不是因为样本中的偏差,而是因为您可能需要以不同的方式构建模型首先要挑选出不同的特征。

即使在像图像识别这样的狭窄应用中,机器学习系统也是不可互换的。您必须调整系统的结构,有时只是通过反复试验,以便善于发现您感兴趣的数据中的特定功能,直到达到所需的准确度。但是你可能没有意识到系统对于一组而言准确率为98%,但对于另一组而言只有91%准确(即使该准确度仍然超过人类分析)。

我们将使用ML来做很多事情,样本偏差将成为所有这些问题的一部分考虑因素。同样,即使您与人合作,数据中的偏差也可能与人无关。

AI偏差管理

我们该怎么办?您可以将现场思维分为三个方面:

在训练数据的收集和管理中的方法严谨性

用于分析和诊断模型行为的技术工具。

在产品中部署ML的培训,教育和谨慎。

样板偏差关键是来自于我们自己先验地可能对不同的人群数据有偏见。

在这种情况下,我经常将机器学习与数据库进行比较,特别是关系数据库 - 一种新的基础技术,它改变了计算机科学的可能性,改变了更广阔的世界,成为了所有东西的一部分,我们现在使用一直没有注意到。

但数据库也存在问题,而且问题具有相同的特征:系统可能建立在错误的假设或糟糕的数据之上,一直使用它的人很难意识到这点更不会去质疑。

比如税务系统中如果登记你的名字写错了,更容易的是让改变你的名字,而不是让他们修改数据库中的拼写字母,这被认为是SQL固有的技术问题,Oracle的执行失败,或大型官僚机构的制度性失败?如何轻松地确定部署系统的确切过程,无法修复拼写错误,或者知道在人们开始抱怨之前已经完成了这个操作?

所有这一切都是说,ML偏见会以与过去问题大致相同的方式引起问题,并且可以解决和发现,或者不会,与过去大致相同的程度。因此,人工智能偏见导致最容易想象的伤害的情景可能不是来自主要机构的主要研究人员。相反,它是第三层技术承包商或软件供应商,它将开源组件,图书馆和工具中的某些内容与其真正理解的东西联系在一起,然后将其出售给在贴纸上看到“AI”的不熟练买家。不要问正确的问题,把它交给最低工资的员工,并告诉他们做'AI'所说的任何事情。这是数据库发生的事情。这不是特别是AI问题,甚至是“软件”问题。 

结论

“机器学习可以做任何你可以训练狗去做的事情 - 但你从来都不能完全确定你训练狗去做什么。”

我经常认为“人工智能”这个词在这样的对话中是无用的。它创造了我们实际创造的大部分错误印象,这些只是机器,将它们与洗衣机进行比较会更有用。在洗衣服时,洗衣机比人类要好得多,但是如果你把洗碗机放在洗衣机而不是衣服上并按下开始,它就会洗掉它们。他们甚至会变得干净。但这不是你想要的结果,也不会是因为系统偏向于菜肴。洗衣机不知道什么衣服或餐具 - 它只是一个自动化,它在概念上与以前的任何自动化浪潮都没有什么不同。

也就是说,就像汽车,飞机或数据库一样,这些系统既强大又极其有限,完全取决于人们如何使用这些系统,以及用户的好坏,以及受过良好教育或无知的人这些系统是如何工作的。

因此,说'人工智能是数学,所以它不会有偏差'是完全错误的。ML在数据中找到模式 - 哪些模式取决于数据,数据取决于我们,我们用它做什么取决于我们。机器学习在做某些事情方面要比人们好得多,就像一只狗在寻找毒品方面要比人们好得多,但你不会因狗的证据而定罪。而且狗比任何机器学习都聪明得多。

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

LED驱动电源的输入包括高压工频交流(即市电)、低压直流、高压直流、低压高频交流(如电子变压器的输出)等。

关键字: 驱动电源

在工业自动化蓬勃发展的当下,工业电机作为核心动力设备,其驱动电源的性能直接关系到整个系统的稳定性和可靠性。其中,反电动势抑制与过流保护是驱动电源设计中至关重要的两个环节,集成化方案的设计成为提升电机驱动性能的关键。

关键字: 工业电机 驱动电源

LED 驱动电源作为 LED 照明系统的 “心脏”,其稳定性直接决定了整个照明设备的使用寿命。然而,在实际应用中,LED 驱动电源易损坏的问题却十分常见,不仅增加了维护成本,还影响了用户体验。要解决这一问题,需从设计、生...

关键字: 驱动电源 照明系统 散热

根据LED驱动电源的公式,电感内电流波动大小和电感值成反比,输出纹波和输出电容值成反比。所以加大电感值和输出电容值可以减小纹波。

关键字: LED 设计 驱动电源

电动汽车(EV)作为新能源汽车的重要代表,正逐渐成为全球汽车产业的重要发展方向。电动汽车的核心技术之一是电机驱动控制系统,而绝缘栅双极型晶体管(IGBT)作为电机驱动系统中的关键元件,其性能直接影响到电动汽车的动力性能和...

关键字: 电动汽车 新能源 驱动电源

在现代城市建设中,街道及停车场照明作为基础设施的重要组成部分,其质量和效率直接关系到城市的公共安全、居民生活质量和能源利用效率。随着科技的进步,高亮度白光发光二极管(LED)因其独特的优势逐渐取代传统光源,成为大功率区域...

关键字: 发光二极管 驱动电源 LED

LED通用照明设计工程师会遇到许多挑战,如功率密度、功率因数校正(PFC)、空间受限和可靠性等。

关键字: LED 驱动电源 功率因数校正

在LED照明技术日益普及的今天,LED驱动电源的电磁干扰(EMI)问题成为了一个不可忽视的挑战。电磁干扰不仅会影响LED灯具的正常工作,还可能对周围电子设备造成不利影响,甚至引发系统故障。因此,采取有效的硬件措施来解决L...

关键字: LED照明技术 电磁干扰 驱动电源

开关电源具有效率高的特性,而且开关电源的变压器体积比串联稳压型电源的要小得多,电源电路比较整洁,整机重量也有所下降,所以,现在的LED驱动电源

关键字: LED 驱动电源 开关电源

LED驱动电源是把电源供应转换为特定的电压电流以驱动LED发光的电压转换器,通常情况下:LED驱动电源的输入包括高压工频交流(即市电)、低压直流、高压直流、低压高频交流(如电子变压器的输出)等。

关键字: LED 隧道灯 驱动电源
关闭