当前位置:首页 > 智能硬件 > 人工智能AI
[导读] 随着谷歌人工智能AlphaGo与李世石的五局人机大战落下帷幕,阿法狗最终以4:1大比分战神李世石,人们对于阿法狗的好奇心被推向了高潮。阿法狗也将深度学习神经网络即DNN的强大能力展示在了人们面前

随着谷歌人工智能AlphaGo与李世石的五局人机大战落下帷幕,阿法狗最终以4:1大比分战神李世石,人们对于阿法狗的好奇心被推向了高潮。阿法狗也将深度学习神经网络即DNN的强大能力展示在了人们面前。

| 什么是DNN?

那到底什么是DNN呢?DNN是近年人工智能领域的热门,在语音识别自动驾驶、笔迹识别等方面的应用都极为成功。在人工智能领域,神经网络是一种模拟生物神经系统的模型,由许多单向连接的神经元组成,可根据链接神经元的各种参数将输入信号转换为输出信号。相比于普通的神经网络,深度神经网络(DNN)使用隐含的多层复杂结构,以及非线性变换,来表达对数据的高度抽象。这些特征更接近于人类大脑,更容易实现人类大脑的某些功能,例如下围棋所需要的脑功能。

阿法狗应用了两种深度学习神经网络,即“策略网络”和“价值网络”来拟合局面策略函数和评估函数,可以说这就是阿法狗的两个大脑。阿法狗的胜利引爆了DNN这一概念,在大数据当道的今天,深度学习神经网络已经被应用到非常多的领域,成为了揭示科学原理、升级现有产业商业模式的重要工具。

| DNN如何应用在手势识别中呢?

那么如此炫酷的DNN能否应用在大热的VR行业?答案是肯定的。目前VR领域中应用到DNN技术的包括语音识别、手势识别等方面,笔者在这里主要介绍一下手势识别算法中的DNN。

传统的手势识别方法主要有两种:基于数据手套的手势识别方法、基于计算机视觉的手势识别方法。

而基于计算机视觉的手势识别方法以其不依赖于设备,更自然的人机交互效果,更好的沉浸感成为当今研究的热点。基于计算机视觉手势识别从摄像机中得到手势图像信息,经过适当的数据预处理之后从图像中分割出手势,对分割得到的手势进行特征提取后,利用已经建立好的手势模板进行分类。

传统的分类方式有模板匹配、基于指尖检测方法等,但这些方法都需要人工从图像提取出目标特征,编写模板来匹配。随着深度学习神经网络被提出,基于深度学习神经网络(DNN)的手势识别也应运而生,这种手势识别算法相比于传统手势识别算法在各个方面均有非常大的优势。

深度学习神经网络的工作方式来自于同人脑视觉机理的类比学习,这种从原始输入开始向更高层次不停抽象迭代的过程赋予了该模型高度抽象的能力,使得深度学习神经网络能够非常有效地从大量有标签数据中深度提取数据的特征信息,充分挖掘数据的内在属性和有价值的表征数据,然后组合低层特征为更加抽象的高层特征,而高级特征则是数据更高级、更本质的描述,由此可以在分类问题上得到更优的结果。

众所周知,VR行业面临的一大技术难题就是海量数据的处理,对于手势识别技术更是如此,手部有非常多的关节,需要非常强的识别能力才可以准确的识别每个精细动作。而深度学习模型的多隐藏层结构使得模型能有效利用海量数据进行训练,所使用数据越多模型性能越高,非常适合在VR环境下做手势识别。

基于计算机视觉的手势识别中,传统算法无法直接有效地从图像中提取出对目标有用的信息。而深度学习的学习能力却异常强大,即使是复杂低分辨率图像也能够很好的提取出目标深度特征。基于DNN的手势识别所需的图像背景并不需要固定,算法甚至在一定范围内允许运动背景的存在,从而提高了识别的环境耐受力和精细度。

| DNN在手势识别中如何实现?

接下来笔者将介绍一下具体的实现方法。

传统的识别系统流程大体上可以分成检测、识别、跟踪这三个步骤,具体实现流程是:传感器获取信息,预处理,特征提取,特征选择,再到最后的推理、预测或者识别。通常认为最后一部分是属于机器学习的部分,这部分是整个系统的精髓所在,它能否从数据中学到有效的知识直接关系到整个系统能否按照人们期望的那样工作,但同时也存在前期特征提取或者选择不好的情况,这样会影响系统性能。

而基于DNN的手势识别就是让机器自己去提取特征,不需要手工特征提取,强大的学习能力使得模型在复杂背景下也能取得理想效果,其手势识别过程如下:

首先创建手势识别采集系统,做运动目标检测,并在检测的同时提取出前景的即运动目标的部分信息,获得手势图像。采集到手势图像之后根据不同应用场景选择合适的网络协议,把数据传输到计算平台利用深度学习算法进行复杂背景手势识别,并最终给出手势识别结果。

| 基于DNN实现的VR会是什么样的?

基于DNN算法的思想实现的VR产品,并使用单机GPU方法来加速深度网络的训练和识别工作。手势识别模组可以使用深度摄像头实现手部近距离3D成像,结合DNN自主研发了一套数据处理算法,实现了高精度实时手部动作识别,既能跟踪单个手指,识别每个手指细微的动作,也可扩展至跟踪多只手。

这样的VR产品的手势识别具有捕捉精度高,响应速度快,灵敏度高,可以不受环境光线强弱影响,室内室外都可以使用。

不过目前市面上几乎没有基于DNN的手势识别产品。笔者所知的G-Wearables自主研发的StepVR产品就是基于DNN算法实现的,但还未见到实物,可以期待一下。

本站声明: 本文章由作者或相关机构授权发布,目的在于传递更多信息,并不代表本站赞同其观点,本站亦不保证或承诺内容真实性等。需要转载请联系该专栏作者,如若文章内容侵犯您的权益,请及时联系本站删除。
换一批
延伸阅读

LED驱动电源的输入包括高压工频交流(即市电)、低压直流、高压直流、低压高频交流(如电子变压器的输出)等。

关键字: 驱动电源

在工业自动化蓬勃发展的当下,工业电机作为核心动力设备,其驱动电源的性能直接关系到整个系统的稳定性和可靠性。其中,反电动势抑制与过流保护是驱动电源设计中至关重要的两个环节,集成化方案的设计成为提升电机驱动性能的关键。

关键字: 工业电机 驱动电源

LED 驱动电源作为 LED 照明系统的 “心脏”,其稳定性直接决定了整个照明设备的使用寿命。然而,在实际应用中,LED 驱动电源易损坏的问题却十分常见,不仅增加了维护成本,还影响了用户体验。要解决这一问题,需从设计、生...

关键字: 驱动电源 照明系统 散热

根据LED驱动电源的公式,电感内电流波动大小和电感值成反比,输出纹波和输出电容值成反比。所以加大电感值和输出电容值可以减小纹波。

关键字: LED 设计 驱动电源

电动汽车(EV)作为新能源汽车的重要代表,正逐渐成为全球汽车产业的重要发展方向。电动汽车的核心技术之一是电机驱动控制系统,而绝缘栅双极型晶体管(IGBT)作为电机驱动系统中的关键元件,其性能直接影响到电动汽车的动力性能和...

关键字: 电动汽车 新能源 驱动电源

在现代城市建设中,街道及停车场照明作为基础设施的重要组成部分,其质量和效率直接关系到城市的公共安全、居民生活质量和能源利用效率。随着科技的进步,高亮度白光发光二极管(LED)因其独特的优势逐渐取代传统光源,成为大功率区域...

关键字: 发光二极管 驱动电源 LED

LED通用照明设计工程师会遇到许多挑战,如功率密度、功率因数校正(PFC)、空间受限和可靠性等。

关键字: LED 驱动电源 功率因数校正

在LED照明技术日益普及的今天,LED驱动电源的电磁干扰(EMI)问题成为了一个不可忽视的挑战。电磁干扰不仅会影响LED灯具的正常工作,还可能对周围电子设备造成不利影响,甚至引发系统故障。因此,采取有效的硬件措施来解决L...

关键字: LED照明技术 电磁干扰 驱动电源

开关电源具有效率高的特性,而且开关电源的变压器体积比串联稳压型电源的要小得多,电源电路比较整洁,整机重量也有所下降,所以,现在的LED驱动电源

关键字: LED 驱动电源 开关电源

LED驱动电源是把电源供应转换为特定的电压电流以驱动LED发光的电压转换器,通常情况下:LED驱动电源的输入包括高压工频交流(即市电)、低压直流、高压直流、低压高频交流(如电子变压器的输出)等。

关键字: LED 隧道灯 驱动电源
关闭