当前位置:首页 > 智能硬件 > 人工智能AI
[导读] Google 的人工智能机器人将普通的照片生成了带有幻觉的图像,工程师们把这些图像和梦境进行比较,并将 Google 的这种图像生成手法命名为“盗梦风格”(Inceptionism),将所使用的

Google 的人工智能机器人将普通的照片生成了带有幻觉的图像,工程师们把这些图像和梦境进行比较,并将 Google 的这种图像生成手法命名为“盗梦风格”(Inceptionism),将所使用的生成代码叫做“深度梦境”(Deep Dream)。

但是许多人在观看了这些图像之后都有一个相同感受:它们并不是来自一个梦幻的世界,而是嗑药之后的反应。

在电脑生成的图像中充斥着色彩的变幻,扭曲的线条,拉长的脸孔,漂浮着的眼睛,以及由阴影和光线组成的、令人不安的波浪形状。电脑看起来像是出现了幻觉,看起来有点像是人类,太奇怪了。

深度梦境

这个项目背后的主旨是,通过命令机器描述它所看到的画面,来测试计算机神经网络对不同动物和风景图像的学习达到了一种怎样的程度。与以往向计算机展示一幅树木的图片,之后让它“告诉我这是什么”的做法不同,工程师这一次让机器做的事情是“放大你看到的图像元素。”

Google 工程师表示,这种效果与人们可能从不同形状的云朵中看出形状的情况并无不同。当给出能够辨识出的图像时,人类——还有计算机——会分辨并“过度解读”(over-interpret) 已知事物的形状。

“(Google 所使用的) 神经网络主要靠动物图像进行训练,所以很自然地它就会将图形解读成动物。但因为数据是以很高的抽象程度被存储的,所以结果就是这些机器学习特征的有趣组合,”Google 工程师在该公司的官方博客上这样写道,“基于图像的不同,结果也非常不一样,因为输入图像的特征会导致神经网络倾向形成某些解读。比如,水平线条会用佛塔的造型填充,岩石和树木会变成建筑。鸟和昆虫出现在叶子的图像里。”

因为神经网络以层的形式分析图像——通过色彩、线条类型和形状描述,等等——生成结果的复杂程度取决于工程师要求计算机放大的是哪个层。最低一级的层是轮廓——线和阴影——最高一层则是更加复杂的画面。“比如,偏低的层往往会生成笔画线或是简单的像装饰一样的图案,因为这些层对于基本特征如边缘和方向这些属性来说要比较敏锐。”Google 工程师这样写道。

这些简单的图案模式,经由“深度梦境”放大强化之后,结果看上去就变得扭曲和魔幻。但是为什么画面会变成这样,仍旧没有回答 人们提出的问题:为什么电脑神经网络“梦到”的画面会反应出人类嗑药后才有的致幻体验?

视觉体验

“要记住很重要的一点是,人类所有正常的感观体验都是经由感观输入限制后的幻觉,”纽约大学兰恭神经科学所 (New York University’s Langone Neuroscience InsTItute) 研究助教 Lucas Sjulson 这样说道,“我们的幻觉从某种程度上说反映出外在世界的真实情况。但是感知全都是在内部形成的。”

换句话说,所有人类感知都是由大脑思维形成,而不在真实世界形成,即便你感知到的是真实存在也是如此。“人们将眼睛看作像摄像头一样,但其实不是,”Lucas Sjulson 解释说。你的眼睛能够让你看到东西,但你的大脑才是真正将看到的事物进行解释的器官——无论是放在桌上的咖啡杯,还是在你脑中投射分型图像的万花筒。

当人们使用致幻药物的时候 (LSD),会刺激大脑的某个皮层“产生这一类模式的形成能力”。所以当习惯处理多层图像的电脑被命令针对某一层图像进行放大时,出现类似的视觉效果,就不奇怪了。“我认为这大概是类似现象的一个例子。如果你研究一下头脑的运作,会发现它参与长时间解决问题的活动,而且以一种高度优化的方式进行。人类在进化中学习,同样也要靠视觉体验。

人工智能与人类大脑的相似之处

视觉体验也是人类训练计算机视觉的方法。神经网络识图的方式,与电脑“看到的”具体图像相比,前者可能对回答之前的问题更有帮助。也就是,Google 工程师最初希望探索的到底是什么。

“我们实际上始终会‘看到’并没有的东西,”纽约大学心理学家 Jeffrey Guss 这样说道,他的研究课题是在一些毒蘑菇中出现的致幻物质如何帮助癌症患者进行治疗。“我们的视觉皮层——而不是我们的眼部——专门用于捕捉可识别的模式去观察我们眼睛提供的信息。有许多心理学试验表明,我们经常看到期望看到的事物以及被事前告知将看到的事物,而不是真正存在的事物。”

尽管致幻体验常常和嗑药文化联系起来,但人们的确会稳定地出现奇异的视觉体验,即便是他们在没有受到影响的情况下。已故的神经科学家 Oliver Sacks 在他的作品《幻觉》一书中指出,这种体验要比许多人所意识到的更普遍。“在其他一些文化中,幻觉被认为是来自上帝或缪思的馈赠,但是当代社会在公众当中却有一种不详的含义,在医学上也是,往往被认为是严重精神或神经疾病的征兆,”他在 2012 年发布的文章中这样写道,“对许多人来说,拥有幻觉是一个恐怖的秘密——有数百万人——他们从不提起,也很难承认,但这并没有什么不寻常。”

在人类的大脑中,诡异的图像感知与眼部、头部和其他状况有一定联系:比如偏头痛、发热和痉挛等。在计算机的脑中,类似的图案表明,人工智能要比他们看上去更像人类。Google 的“盗梦风格”对人类来说好像服药后的致幻体验一样,这个事实说明我们的大脑机能从某种意义上说“在深层次中”与电脑神经网络有相似之处。

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

LED驱动电源的输入包括高压工频交流(即市电)、低压直流、高压直流、低压高频交流(如电子变压器的输出)等。

关键字: 驱动电源

在工业自动化蓬勃发展的当下,工业电机作为核心动力设备,其驱动电源的性能直接关系到整个系统的稳定性和可靠性。其中,反电动势抑制与过流保护是驱动电源设计中至关重要的两个环节,集成化方案的设计成为提升电机驱动性能的关键。

关键字: 工业电机 驱动电源

LED 驱动电源作为 LED 照明系统的 “心脏”,其稳定性直接决定了整个照明设备的使用寿命。然而,在实际应用中,LED 驱动电源易损坏的问题却十分常见,不仅增加了维护成本,还影响了用户体验。要解决这一问题,需从设计、生...

关键字: 驱动电源 照明系统 散热

根据LED驱动电源的公式,电感内电流波动大小和电感值成反比,输出纹波和输出电容值成反比。所以加大电感值和输出电容值可以减小纹波。

关键字: LED 设计 驱动电源

电动汽车(EV)作为新能源汽车的重要代表,正逐渐成为全球汽车产业的重要发展方向。电动汽车的核心技术之一是电机驱动控制系统,而绝缘栅双极型晶体管(IGBT)作为电机驱动系统中的关键元件,其性能直接影响到电动汽车的动力性能和...

关键字: 电动汽车 新能源 驱动电源

在现代城市建设中,街道及停车场照明作为基础设施的重要组成部分,其质量和效率直接关系到城市的公共安全、居民生活质量和能源利用效率。随着科技的进步,高亮度白光发光二极管(LED)因其独特的优势逐渐取代传统光源,成为大功率区域...

关键字: 发光二极管 驱动电源 LED

LED通用照明设计工程师会遇到许多挑战,如功率密度、功率因数校正(PFC)、空间受限和可靠性等。

关键字: LED 驱动电源 功率因数校正

在LED照明技术日益普及的今天,LED驱动电源的电磁干扰(EMI)问题成为了一个不可忽视的挑战。电磁干扰不仅会影响LED灯具的正常工作,还可能对周围电子设备造成不利影响,甚至引发系统故障。因此,采取有效的硬件措施来解决L...

关键字: LED照明技术 电磁干扰 驱动电源

开关电源具有效率高的特性,而且开关电源的变压器体积比串联稳压型电源的要小得多,电源电路比较整洁,整机重量也有所下降,所以,现在的LED驱动电源

关键字: LED 驱动电源 开关电源

LED驱动电源是把电源供应转换为特定的电压电流以驱动LED发光的电压转换器,通常情况下:LED驱动电源的输入包括高压工频交流(即市电)、低压直流、高压直流、低压高频交流(如电子变压器的输出)等。

关键字: LED 隧道灯 驱动电源
关闭