Physical Intelligence联合创始人Chelsea Finn:深度解读机器人革命浪潮 | Physical Intelligence 完成B轮 6 亿美元融资,公司估值达56亿美元,谷歌、贝索斯领投|机器人的学习机制、为物理世界训练人工智能模型所面临的挑战 | 机器人技术的发展与自动驾驶汽车的对比 80

原文引用:
Physical Intelligence联合创始人:切尔西・芬恩,现任斯坦福大学现任副教授、学习与交互智能实验室负责人,在访谈中深入探讨了机器人的学习机制、为物理世界训练人工智能模型所面临的挑战,以及多样化数据对于实现通用智能的重要意义。切尔西阐释了开源与闭源机器人技术的发展格局演变,同时分析了人工智能模型最有可能率先产生重大影响的领域。他们还将机器人技术的发展与自动驾驶汽车进行对比,展望了人形与非人形机器人的未来发展方向,并探讨了人工智能要在现实世界中高效运转仍需突破的关键瓶颈。如果你对人工智能跳出数字领域、迈向新阶段的发展动态充满好奇,那么本期节目绝对不容错过。《No Priors》
市场空白:
原文总结:
{"highlight":[{"answer":"是的。所以我们正在尝试构建一个大型神经网络模型,最终可以控制任何机器人在任何场景下做任何事情。我们愿景的很大一部分是,过去机器人技术专注于深入研究一个应用,并开发一个机器人来完成一项任务。然后最终被困在那个应用中。解决一个问题然后试图摆脱它并扩大范围真的很难。相反,我们是为了长期解决现实世界中的物理智能这一更广泛的问题。我们正在大量思考泛化能力,通用智能体。与其他机器人公司不同,我们认为能够利用所有可能的数据非常重要。这不仅涉及利用一个机器人的数据,还包括任何可能有六个关节或七个关节、两个手臂或一个手臂的机器人平台的数据。我们已经看到很多证据表明,你实际上可以在这些不同的实体之间传递大量丰富的信息,并且能够使用数据。此外,如果你迭代你的机器人平台,你不必丢弃所有数据。过去我曾经历过很多痛苦,当我们获得新版本的机器人时,你的策略就不起作用了。试图回到你在前一个机器人迭代中所处的位置是一个非常痛苦的过程。所以,是的,我们正在尝试构建通用机器人,并本质上开发基础模型,这些模型将为现实世界中的下一代机器人提供动力。","question":"我知道您与其他四位联合创始人以及一个令人印象深刻的团队一起创立了Physical Intelligence。您能多介绍一下Physical Intelligence正在做什么以及你们采取的方法吗?因为我认为这在整个领域和方法上都是一个相当独特的视角。"},{"answer":"当然。所以我们实际上一直非常开放。我们不仅开源了一些权重并在技术论文中发布了细节,我们实际上还与硬件公司合作,并将机器人设计提供给硬件公司。当我告诉人们这一点时,有些人实际上真的很震惊,比如,知识产权呢?保密之类的呢?我们实际上在这方面做出了非常有意的选择。有几个原因。一是我们认为这个领域才刚刚开始。这些模型将会变得越来越好。机器人在一年、三年内应该会变得好得多。我们希望支持研究的发展。我们希望支持社区,支持机器人,以便当我们有希望开发这些通用模型的技术时,世界会更准备好迎接它。我们将拥有更好的、更强大的机器人,能够利用这些模型。拥有专业知识并了解使用这些模型所需条件的人。另一件事是,我们有一支非常优秀的研究人员和工程师团队。真正优秀的研究人员和工程师希望在开放的公司工作,特别是研究人员,他们可以获得对其工作的认可,分享他们的想法,谈论他们的想法。我们认为拥有最优秀的研究人员和工程师对于解决这个问题是必要的。我要提到的最后一件事是,我认为这个赌注的最大风险是它不会奏效。我并不真的担心竞争对手。我更担心没有人会解决这个问题。","question":"我认为你到目前为止采取的很多方法都非常强调为机器人技术发布开源模型和软件包。你认为这是长期的道路吗?你认为这是开放核心吗?你认为最终会是专有模型吗?或者你如何在行业背景下思考这个问题?因为现在感觉有几家不同的机器人公司在硬件加软件方面采取了不同的方法,他们专注于特定的硬件足迹。有软件,如果你只做软件,有闭源与开源之分。所以我有点好奇Physical Intelligence在这个范围内处于什么位置。"},{"answer":"是的,所以我认为第一件事,这可能有点无聊,就是获取更多样化的机器人数据。所以对于我们去年10月底的那个发布,我们严格来说是在三座建筑物中收集数据。例如,互联网以及推动语言模型和视觉模型发展的一切都比这多样化得多,因为互联网是由许多人拍摄的照片和许多不同的人写的文本组成的。所以只是试图在更多不同的地方收集数据,使用更多的物体,更多的任务。因此,扩大数据的多样性,而不仅仅是数据的数量,非常重要。这是我们目前重点关注的一件大事,实际上是将我们的机器人带到很多不同的地方并在那里收集数据。作为其副产品,我们还了解了如何让你的机器人在许多不同的地方运行和工作。这是一个非常好的副产品,因为如果你真的想让机器人在现实世界中工作,你需要能够做到这一点。所以这是第一件事。但我们也在探索其他事情,利用人们的视频,同样,利用网络数据,利用预训练模型,思考推理,尽管是更基本形式的推理。例如,为了将脏衬衫放进洗衣篮,如果你能识别出衬衫在哪里,洗衣篮在哪里,以及你需要做什么来完成这项任务,那是有用的。或者如果你想做三明治,而用户有特定的要求,你应该通过该请求进行推理。如果他们对泡菜过敏,你可能不应该在三明治上放泡菜,诸如此类的事情。所以那里有一些基本的东西,尽管第一件事只是更多样化的机器人数据。","question":"这真的很神奇。那么你认为实现真正泛化能力的主要基础是什么呢?是进一步扩大数据规模?是扩大计算能力?是两者的结合?是其他形式的后训练还是别的什么?我只是有点好奇,当你考虑人们现在关注的共同要素时,你认为哪些需要填补。显然,在语言模型领域,人们也花了很多时间在推理模块和其他类似的事情上。所以我很好奇,你觉得现在缺少哪些组件?"}]}
原文:

评论

登录后发表评论
×