当前位置:首页 > 智能硬件 > 机器视觉
[导读] 据报道,UCSB研究发现计算机与人类视觉具有很大的差异,即使机器视觉方面取得了巨大的进步,仍然无法比得上动物在复杂场景的视觉搜索方面的能力,如何用人眼搜索策略提升计算机视觉至关重要。因此,当目标

据报道,UCSB研究发现计算机与人类视觉具有很大的差异,即使机器视觉方面取得了巨大的进步,仍然无法比得上动物在复杂场景的视觉搜索方面的能力,如何用人眼搜索策略提升计算机视觉至关重要。因此,当目标物体与场景的大小不一致时,看漏了目标并不是人类的缺陷;相反,它是一种有用的策略的副产品,即大脑能够快速减少潜在的干扰物的影响。

在继续阅读之前,请观察下图,找出图中所有的牙刷。

你注意到图中左边那支巨大的牙刷了吗?可能没有。根据加州大学圣巴巴拉分校心理学与脑科学系的科学家们的说法,这是因为当人类在寻找一个特定的物体时,经常容易看漏大小与场景的其余部分不相匹配的物体。

加州大学圣巴巴拉分校的研究人员发现,当人类在寻找一个特定的物体时,经常容易看漏大小与场景的其余部分不相匹配的物体。他们研究这一现象,试图更好地理解人类和计算机在进行视觉搜索时的区别,提出利用人类的视觉搜索策略提高计算机视觉能力。

当人类在寻找一个特定的物体时,经常容易看漏大小与场景的其余部分不相匹配的物体。

科学家们正在研究这一现象,试图更好地理解人类和计算机在进行视觉搜索时的区别。他们的发现发表在最新一期 Current Biology 杂志上。

藏在眼皮底下

“当某些东西以不同寻常的大小出现时,你会更经常地看漏,因为你的大脑会自动忽略它,”UCSB教授Miguel Eckstein说,他专门研究计算人类视觉(computaTIonal human vision)、视觉注意力和搜索。

该实验使用的是计算机生成的图像中的普通物体的场景,这些图像的颜色、角度和大小不一,并混进“目标缺失”的场景。研究人员要求60名被试者在这些图像中搜索特定物品(例如:牙刷、停车计时器、鼠标),并使用眼球追踪软件监控他们的视线。

研究人员发现,当物体大小与寻常大小差别很大(太大或太小)时,人们往往会更容易忽略目标,哪怕他们已经直直地盯着目标对象。

相比之下,根据科学家们的报告,计算机视觉不会出现这个问题。但是,在实验中,研究人员发现,最先进的计算机视觉技术——深度神经网络——也有其自身的局限性。

人类搜索策略可以改进计算机视觉

深度学习算法将红色框里的键盘错误地识别为手机(来源:UC Santa Barbara)

例如,一个CNN深度学习神经网络错误地将计算机键盘识别为手机,它基于形状的相似性,以及物体相对手的位置(手机经常被拿在手中)。但对人类来说,这个物体的大小(相对于人的手)显然与手机是不一致的。

研究人员在论文中指出:“这种策略可以让人在快速做决策时减少失误。”

Eckstein说:“我们的想法是,当你第一次看到一个场景时,你的大脑会在几百毫秒甚至更短的时间里快速处理这个场景的信息,然后你会使用这些信息来引导你寻找物体出现的典型位置。”“同时,你也会把注意力集中在那些与你所寻找的物体大小一致的物体上。”

也就是说,人类的大脑利用物体间的关系来引导他们的眼睛——这是一个快速处理场景信息的有用策略,可以消除干扰,减少误报。

根据研究人员的说法,通过利用大脑用来减少误报的一些技巧,这一发现可能对改善计算机视觉有所启发。

未来的研究

Eckstein说:“有一些理论认为,患有自闭症谱系障碍的人更关注局部的场景信息,而不是整体的结构。”Eckstein正在计划一项后续研究,他说:“因此,有一种可能性是,患有自闭症谱系障碍的人可能更不容易看漏那些被错误放大的物体,但在我们进行这项研究之前,尚没法确定这一点。”

接下来,研究人员将关注当我们看到错误放大的物体时发生的大脑活动。

博士后研究员Lauren Welbourne说:“有许多研究已经确定了大脑中处理场景和物体的区域,现在研究人员正在努力了解这些场景和物体的哪些特定属性被呈现给大脑的这些区域。”目前的研究主要集中在物体是如何在大脑皮层上呈现,以及场景背景如何影响物体的感知。

他说:“所以我们要做的是找出这些大脑区域对在一个场景中正确或错误地缩放的物体是如何做出反应的。这可能有助于我们确定哪些区域对使我们看漏被错误放大的物体有影响。”

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

随着科技的不断发展,人脸识别技术已经广泛应用于各个领域,如手机解锁、门禁系统、支付验证等。在考勤管理领域,人脸识别考勤机也逐渐取代了传统的指纹考勤机和刷卡考勤机,成为了许多企业的首选。然而,任何技术都有其局限性,人脸识别...

关键字: 人脸识别 考勤机 计算机视觉

通用人工智能(Artificial General Intelligence,AGI)是指具有类似于人类综合智能的人工智能系统。它能够执行多种任务,并在没有人类干预的情况下独立学习和改进。通用人工智能的目标是创建一种能够...

关键字: 人工智能 智能系统 计算机视觉

12月11日,2023中国浙江网上技术市场活动周暨首届浙江科技创新合作大会在杭州举行。湖畔实验室(阿里巴巴达摩院)的三项技术成果“医疗AI胰腺癌早筛技术”“遥感影像AI解译通用模型”“基于最新一代标准的编解码方案Ali2...

关键字: 计算机视觉 深度学习模型 Al

英特尔研究院将重点展示31项研究成果,它们将推进面向未来的AI创新。

关键字: AI 计算机视觉 AI驱动

专为中国计算机视觉市场优化设计, Metavision® EVK5 是一款高速、经济高效、紧凑的评估套件

关键字: 视觉传感器 计算机视觉 索尼

MATLAB是美国MathWorks公司出品的商业数学软件,用于数据分析、无线通信、深度学习、图像处理与计算机视觉、信号处理、量化金融与风险管理、机器人,控制系统等领域。

关键字: matlab软件 计算机视觉 信号处理

MATLAB是美国MathWorks公司出品的商业数学软件,用于数据分析、无线通信、深度学习、图像处理与计算机视觉、信号处理、量化金融与风险管理、机器人,控制系统等领域。

关键字: matlab 程序设计 计算机视觉

MATLAB是美国MathWorks公司出品的商业数学软件,用于数据分析、无线通信、深度学习、图像处理与计算机视觉、信号处理、量化金融与风险管理、机器人,控制系统等领域。

关键字: matlab 计算机视觉 信号处理

今天,我们将讨论计算机视觉。我们将听到 Perceive 的首席执行官 Steve Teig 谈论他提出的一种压缩激活的方法,该方法可以减少 AI 推理所需的内存大小。我们还将先睹为快,了解来自 GrAI Matter...

关键字: 计算机视觉 压缩技术

最近的数据显示,可持续发展正跃升为企业议程的重要事项——近一半(48%)的全球首席执行官表示,提高可持续性是他们的首要任务之一,较 2021 年以来增长了 37%。2023 年对企业的期待不仅是要制定雄心勃勃的可持续发展...

关键字: 人工智能 计算机视觉 知识图谱
关闭
关闭