当前位置:首页 > 芯闻号 > 极客网
[导读]过去几年里,AI聊天机器人飞速进化,现在很多人将它当成个人助手、客服代表和治疗专家。驱动聊天机器人运行的是大语言模型(LLM),它以机器学习算法作为基础,算法根据互联网海量数据而训练。

过去几年里,AI聊天机器人飞速进化,现在很多人将它当成个人助手、客服代表和治疗专家。驱动聊天机器人运行的是大语言模型(LLM),它以机器学习算法作为基础,算法根据互联网海量数据而训练。

一些科技人士预测,只要短短几年,利用机器学习算法就能孵化各种机器人,比如外科手术机器人、替代工厂工人的机器人、家庭管家机器人等。但加州大学伯克利分校机器人专家肯·戈德伯格(Ken Goldberg)并不认同这种说法。

8月27日,戈德伯格在《Science Robotics》杂志发表两篇论文,指出想让人形机器人获得可以在真实世界应用的技能,速度会极慢——与AI聊天机器人获得技能的速度相差极远,核心原因在于可供人形机器人训练的数据太少了,与AI聊天机器人之间差了10万年。

在第二篇论文中,来自麻省理工学院、佐治亚理工学院和苏黎世联邦理工学院的机器人专家讨论了机器人的未来发展方向,他们展开激烈争论。争论的焦点在于:到底是采集更多数据来训练人形机器人,还是依靠传统工程方法给机器人编程,让它完成现实任务?

以下是加州大学新闻网站与戈德伯格的对话:

问:最近,马斯克等科技领袖谈到了人形机器人的未来,比如,他认为在未来五年内机器人将会超越人类外科医生。你认同这种预测吗?

戈德伯格:机器人技术的确在快速进化,但远未达到马斯克所说的程度。现在的热潮存在炒作,宣传的内容超出了机器人的实际能力。

在视觉和语言领域,ChatGPT展示了惊人成就,但大多研究者对公众认知感到担忧——公众认为问题既然已经解决,明年就能实现突破,实际上太乐观了。

我并不是说马斯克描绘的未来永远不会实现,只是说未来两年、五年或者十年不会发生。

问:未来如果想让人形机器人做手术,或者担任私人管家,存在哪些限制?会在哪些方面遇到困难?

戈德伯格:最重要的难点在于灵活性,比如让人形机器人拿起物体。想拿起一只杯子或者更换灯泡是一件很难的事,现在还没有机器人能做到。

这里有一个悖论,我们管它叫Moravec悖论,也就是说一件事人类可以毫不费力做到,所以我理所当然认为机器人应该也能做到。

如果让人工智能玩国际象棋和围棋,表现比人还好,我们就会问:“为什么机器人不能拿起一个杯子呢?”看起来拿杯子比下棋容易得多。

然而事实并非如此,想拿起杯子,需要对杯子在空间中的位置有清晰感知,需要将手指移动到准确位置,然后以适当的方式捏住,难度相当大。

问:在论文中,你说数据之间存在10万年的差距。所谓的数据差距是什么,AI聊天机器人与人形机器人在实际操作能力上差距又是如何造成的?

戈德伯格:为了计算数据缺口,我查看了互联网上的文本数据量,计算一个人需要多长时间才能阅读完。答案是10万年,要十万年才能读完。我们用这么多的数据训练LLM。

我们用10万年的数据训练文本模型,但想训练机器人,10万年数据微不足道。可以确定的是,训练机器人更复杂,我们需要更多数据。

有人认为,可以观察人类相关视频,从中获取数据。但如果只是看视频图像,根本无法知道动作细节是怎样的,从2D转化为3D也是极具挑战的事。所以这一难题无法解决。

还有一个办法是让机器人运动,获得模拟数据。如果机器人只是奔跑或者表演杂技,用这种方法还不错。你可以让机器人在模拟环境中进行后空翻操作,收集大量数据,在特定情况下,这些数据能应用于机器人。但就灵活性而言,仍然远远不够。

现在有了些工作可以远程操作,像操纵木偶一样操纵机器人,完成各种任务。中国和美国的仓库里已经有类似的工作,但对于人类来说,这样的工作十分枯燥。每工作8小时,就能获得8小时数据,但要获得10万年的数据量,太过漫长。

问:如果不收集数据,能不能推动人形机器人发展?

戈德伯格:目前的机器人技术处在范式转变阶段,有点像物理学发展到量子力学一样。行业分成两派,展开激烈争论。机器人技术正处在争论之中。

一派认为,人形机器人的发展依赖于优秀工程学技术,比如物理学、数学、环境建模。另一派认为,机器人根本不需要使用传统工具和方法,只要有数据,就能让人形机器人走向完美。

第二派鼓舞人心,背后有大量资金支持,但到了研究时,大家争论不休,在传统方法和新方法之间有许多争吵。

问:你认为未来的方向是什么?

戈德伯格:我认为工程、数学、科学仍然极为重要,因为有了这些,机器人才能运行,然后我们就可以收集数据。

当机器人执行任务时,如果表现达到消费者可接受水平,就能将机器人投入市场,接下来在实际运行中持续收集数据。

谷歌Waymo无人驾驶汽车采用上述模式,Ambi包裹分拣机器人也一样,它在仓库真实环境中运行,持续收集数据,不断迭代升级。

声明:该篇文章为本站原创,未经授权不予转载,侵权必究。
换一批
延伸阅读

LED驱动电源的输入包括高压工频交流(即市电)、低压直流、高压直流、低压高频交流(如电子变压器的输出)等。

关键字: 驱动电源

在工业自动化蓬勃发展的当下,工业电机作为核心动力设备,其驱动电源的性能直接关系到整个系统的稳定性和可靠性。其中,反电动势抑制与过流保护是驱动电源设计中至关重要的两个环节,集成化方案的设计成为提升电机驱动性能的关键。

关键字: 工业电机 驱动电源

LED 驱动电源作为 LED 照明系统的 “心脏”,其稳定性直接决定了整个照明设备的使用寿命。然而,在实际应用中,LED 驱动电源易损坏的问题却十分常见,不仅增加了维护成本,还影响了用户体验。要解决这一问题,需从设计、生...

关键字: 驱动电源 照明系统 散热

根据LED驱动电源的公式,电感内电流波动大小和电感值成反比,输出纹波和输出电容值成反比。所以加大电感值和输出电容值可以减小纹波。

关键字: LED 设计 驱动电源

电动汽车(EV)作为新能源汽车的重要代表,正逐渐成为全球汽车产业的重要发展方向。电动汽车的核心技术之一是电机驱动控制系统,而绝缘栅双极型晶体管(IGBT)作为电机驱动系统中的关键元件,其性能直接影响到电动汽车的动力性能和...

关键字: 电动汽车 新能源 驱动电源

在现代城市建设中,街道及停车场照明作为基础设施的重要组成部分,其质量和效率直接关系到城市的公共安全、居民生活质量和能源利用效率。随着科技的进步,高亮度白光发光二极管(LED)因其独特的优势逐渐取代传统光源,成为大功率区域...

关键字: 发光二极管 驱动电源 LED

LED通用照明设计工程师会遇到许多挑战,如功率密度、功率因数校正(PFC)、空间受限和可靠性等。

关键字: LED 驱动电源 功率因数校正

在LED照明技术日益普及的今天,LED驱动电源的电磁干扰(EMI)问题成为了一个不可忽视的挑战。电磁干扰不仅会影响LED灯具的正常工作,还可能对周围电子设备造成不利影响,甚至引发系统故障。因此,采取有效的硬件措施来解决L...

关键字: LED照明技术 电磁干扰 驱动电源

开关电源具有效率高的特性,而且开关电源的变压器体积比串联稳压型电源的要小得多,电源电路比较整洁,整机重量也有所下降,所以,现在的LED驱动电源

关键字: LED 驱动电源 开关电源

LED驱动电源是把电源供应转换为特定的电压电流以驱动LED发光的电压转换器,通常情况下:LED驱动电源的输入包括高压工频交流(即市电)、低压直流、高压直流、低压高频交流(如电子变压器的输出)等。

关键字: LED 隧道灯 驱动电源
关闭