计算机视觉:从图像到人工智能
扫描二维码
随时随地手机看文章
计算机视觉技术基于对视觉数据的自动分析。遵循跨学科的方法,它结合了人工智能,图像处理和计算机科学,以使机器能够获取,解释和理解图像和视频。近年来,这项技术已经发展了很多,首先是由于不断增长的计算能力和大型数据集的可用性而驱动的。
传感器获取的图像经过一系列转换和分析,以根据非常精确的步骤序列提取有用的信息,这些步骤可能包括图像分割,关键特征检测,对象或人识别,以对场景的语义解释。实际上,在计算机视觉过程中,基本阶段之一是图像预处理,通常必须对从传感器获得的原始图像进行改进,这可能包括降低噪声,变形校正或亮度平衡,以确保后续分析算法在高质量数据上起作用。在实施嵌入式系统的情况下,在计算资源受到限制并且每个优化直接影响整体性能的情况下,预处理阶段尤为重要。
下一步是特征提取,这是系统从图像中提取最重要信息的过程的阶段。使用高级机器学习技术,尤其是深层神经网络,系统可以直接从数据中学习,并了解哪些功能与特定任务相关。在这种情况下,卷积神经网络(CNN)已经证明了在复杂图像中识别对象的非凡能力,这要归功于它们能够自动提取特征层次结构直接从原始像素开始。
计算机视觉技术的技术限制
尽管有机会和兴趣,但在嵌入式设备中实施计算机视觉系统,例如工业控制系统,机器人技术,无人机或物联网设备,都引入了一些复杂的挑战。首先,嵌入式设备的有限计算和内存硬件功能需要仔细优化计算机视觉算法。深度神经网络虽然非常有效,但在功率和记忆方面也可能非常昂贵。
要考虑的另一个方面是能源效率:许多嵌入式系统(例如无人机或遥控传感器中使用的系统)都在电池电源上运行,因此在这些情况下,必须最大程度地减少处理器功耗。除此之外,视觉系统的鲁棒性,尤其是在不受控制的环境中。尽管深度学习模型在定义明确的环境中表现出了出色的性能,并且在高质量的数据集中表现出了出色的表现,但它们可能容易受到环境条件的突然变化的影响,例如照明,摄像机角度或噪声的变化,这在工业或室外场景中使用的嵌入式系统中尤其有问题,在此情况下,环境条件可能会发生巨大的变化。
基于计算机视觉的监视设备还引起了人们对面部识别技术滥用或视觉数据收集的侵入性的担忧。因此,必须采取计算机视觉系统设计师的措施,以确保按照隐私法规保护个人数据。
计算机视觉的应用和解决方案
尽管有一些技术限制,如上所述,计算机视觉提供的机会却是巨大的。制造业是该技术的最大受益者之一,该技术将计算机视觉用于质量控制,过程自动化和预测性维护。系统可以检测到与人类相比,精度更高的机械中的产品或异常缺陷,降低成本并提高效率。
在医疗保健领域,计算机视觉正在改变医疗服务,其应用程序从医疗图像的自动诊断到使用摄像机的实时患者监测。汽车行业还在利用计算机视觉的潜力,尤其是在自动驾驶汽车的开发中,计算机视觉允许车辆“看到”其周围环境,并识别障碍物,路标和行人。
模拟设备提供了广泛的计算机视觉产品和解决方案,专门为支持高级机器视觉应用而设计。这些产品涵盖了图像处理的各个方面,并加速了智能机器视觉系统的开发。借助高级技术的全面投资组合,Analog设备如今已成为机器视觉市场中的关键参与者,具有用于众多应用,例如工业和自动化,高级机器人技术,汽车和自动驾驶,医疗保健,医疗成像,远程医疗,远程医疗,诊断图像分析),安全和消费者的集成且可扩展的解决方案。
该公司的关键产品包括针对LIDAR和RADAR系统的集成解决方案,该解决方案是为自动驾驶汽车的计算机视觉应用而设计的,以及将不同技术结合起来以改善周围环境的感知,提供详细的三维图像的ADAS系统。对ADA解决方案的需求不断增长,以将有效的电力管理结合在较小的足迹中,并结合高速连通性,复杂的互连和数据完整性。
高级驾驶员辅助系统(ADA)包括旨在在驾驶时协助驾驶员的技术,从而提高了车辆的安全性和效率。 ADAS功能可以包括障碍物和行人检测,自适应巡航控制,交通标志识别,车道保存,盲点监控和自动紧急制动。 ADA使用传感器,相机,雷达和激光雷达来收集有关周围环境的数据,并协助驾驶员做出正确且安全的决策。在该区域中,模拟设备的雷达传感器在检测移动物体方面的准确性特别值得赞赏。
ADI的下一代ADAS体系结构将AI和机器学习与计算机愿景相结合,以提高对象识别,场景理解和视频分析,同时还可以更快地进行市场。 ADAS系统,包括精确传感,智能电源管理,高速连接性和数据完整性,可以用少量的外部组件实现有效的设计。所有这些ADA功能都可以通过在整个汽车中分布的一组传感器来启用,并与I/O模块,执行器和控制器联网。驾驶员监视系统,停车和自动驾驶汽车摄像头,电动汽车的声警告系统以及紧急车辆检测完成了投资组合。
下一代ADAS系统的灵活性和可扩展性旨在实现高效,精确的操作,降低设计的复杂性并加速开发时间。 ADI提供了精确的传感,智能电源管理和连接性,这些连接支持相机,雷达和激光雷达系统的传感器融合和处理。
ADI还提供了针对捕获高分辨率图像的优化图像传感器,其应用程序从机器视觉到视频获取不等。传感器支持诸如低光图像处理和高动态范围之类的功能,并广泛使用:
· 工业自动化和机器人技术
· 医学成像设备
· ADA和自动驾驶汽车
还有具有低功耗嵌入式视觉功能的高级处理平台和用于图像处理的硬件加速器。所有模拟设备嵌入式视觉解决方案都提供了高级传感器和高性能处理硬件的组合,适用于工业,汽车和医疗保健环境。
例如,诸如Blackfin嵌入式视觉处理器之类的产品范围旨在为视觉应用提供优化的处理能力。 ADI提供处理器和处理解决方案,以处理来自图像传感器的数据流,从而加速推理和视觉分析过程;其中包括针对机器视觉和深度学习进行优化的数字信号处理器(DSP)。
BlackFin ADSP-BF609处理器使用具有独特的管道式视觉处理器(PVP)的双核固定点DSP处理器进行了优化,用于嵌入式视觉和视频分析应用程序。 PVP是一组功能块,与Blackfin核心一起设计,旨在加速图像处理算法并减少整体带宽要求。其他处理器规格包括高级高性能基础架构,较大的片上存储器以及具有广泛连接选项的功能丰富的外围设置。 ADSP-BF609处理器非常适合许多嵌入式视觉应用,例如汽车高级驾驶员辅助系统(ADAS),用于制造,安全性和监视分析的机器视觉和机器人技术以及条形码扫描仪。
ADSD3500是模拟设备TOF产品(例如ADTF3175和ADSD3030)的飞行时间(TOF)深度图像信号处理器。 ADSD3500支持1024×1024分辨率的640×480分辨率和部分深度计算(前相结合)的完整深度,主动亮度和置信度计算。数据流和处理通过集成的ARM Cortex-M33控制。使用专用的硬件和内存进行计算,从而实现低功率TOF深度ISP解决方案。
ADSD3500还控制图像传感器模块的引导,校准数据的加载以及帧的触发。它专为工作温度范围为-25°C至 +85°C,它涉及以下应用程序字段:增强现实(AR)系统,机器人技术,建筑自动化和机器视觉系统。 ADSD3500提供3.47mm x 3.47mm WLCSP软件包。
ADI还提供了一系列高质量的视频采集和传输解决方案,包括高速视频接口,编码器,解码器和收发器。
低成本平台上的计算机视觉
对象检测是人工智能的主要应用之一,它既用于机器学习和深度学习水平。著名的单板计算机品牌Raspberry Pi对嵌入式计算机视觉领域产生了重大影响。由于其紧凑而强大的板,Raspberry Pi即使在低成本设备(例如Pi Camera模块)上也可以运行人造视觉算法,该设备与嵌入式视觉项目的平台完美整合在一起,使其成为当今的业余爱好者,学术研究人员和原始型和真实应用程序的首选工具。
例如,可以通过Tensorflow在Raspberry Pi上实现实时自动对象检测和识别应用程序,这是一个用于机器学习的开源平台,旨在促进机器学习和人工智能模型的构建,培训和部署。为此,您所需要的只是一个常见的Raspberry Pi 3,一个用于获取图像的相机和SD存储卡。
此外,可以训练神经网络在同一图像中检测特定的对象类别,从而将Raspberry Pi转变为用于计算应用程序的高度定制的检测系统。即使是具有无法匹配专业AI硬件的性能的低成本嵌入式平台,也可以运行具有可接受结果的对象识别模型。 Raspberry Pi凭借其多功能性和大型开发社区的支持,为嵌入式视觉应用提供了坚实的基础,使您可以将相机,传感器和硬件加速器集成到设计中。
结论和发展前景
当今,计算机视野代表了现代技术最具动态的前沿之一。计算机视觉系统的设计人员必须在图像和视频处理的计算资源管理,算法的鲁棒性和预期结果的精确度之间实现良好的折衷,而不会忽视节能。得益于该行业中公司的创新,功能强大的硬件平台的开发和实施现在更加易于使用,并为新领域以及越来越智能和执行的解决方案打开了大门,即使在先进的应用程序和极端条件下也是如此。