谷歌DeepMind CEO 哈萨比斯:论AI智能的未来 | 他是AI技术领袖,却摘得诺贝尔化学奖桂冠 | 带领谷歌Gemini3全面反超Chatgpt5的破局者 | AI与生命科学结合的未来 89

原文引用:
哈萨比斯:基本上,我正在做所有我曾经梦想的事情,而且我们在很多方面都处于科学的绝对前沿,包括应用科学和机器学习。这种处于前沿、首次发现新事物的感觉非常令人振奋。 欢迎收听《谷歌DeepMind播客》,对AI来说,这是不同寻常的一年。我们看到重心从大型语言模型转向智能体AI;看到AI加速药物研发,多模态模型集成到机器人和无人驾驶汽车中。这些都是我们在播客中详细探讨过的话题。但作为今年的最后一集,我们想进行一次全面回顾,超越新闻头条和产品发布,思考一个更宏大的问题:这一切究竟将走向何方?哪些科学和技术问题将定义下一阶段?
市场空白:
原文总结:
{"highlight":[{"answer":"当然,最显著的证明就是AlphaFold。想想看,距离AlphaFold(至少是AlphaFold 2)向世界公布已经快五年了,真是不可思议。这证明了我们有可能解决这类核心根本性问题。现在我们正在探索其他领域。在材料科学方面,我希望能研发出室温超导体、更好的电池等等。我认为这些都有可能实现,各种更好的材料都在研究中。我们也在研究核聚变,刚刚宣布了与Deep One的合作——其实我们之前就有合作,但现在与Commonwealth Fusion的合作更加深入了。他们可能是在传统托卡马克反应堆领域最优秀的初创公司,或许最接近实现可行的成果。我们希望帮助加速这一进程,比如帮助他们用磁体约束等离子体,甚至可能参与一些材料设计。这非常令人兴奋。此外,我们还与量子计算团队合作——谷歌量子AI团队的工作非常出色。我们用机器学习帮助他们开发纠错码,或许有一天他们也能反过来帮助我们。","question":"能否更新一下这些核心根本性问题的进展?有哪些即将实现,哪些已经解决或接近解决?"},{"answer":"我认为很多人这么想,尤其是看到其他公司进展较慢时。但我们从未真正遇到所谓的“墙”。我想说的是可能存在收益递减。人们听到这个可能会以为是零收益,要么指数增长,要么渐近停滞。但实际上,两者之间有很大空间,我们正处于这个区间。并不是每次发布新版本,所有基准测试的性能都会翻倍,这可能是三四年前早期的情况。但我们确实看到了显著改进,比如Gemini 3的表现,这些投入和回报都是值得的,而且没有放缓的迹象。确实存在问题,比如可用数据是否耗尽,但有解决方法,比如合成数据。这些系统足够强大,能够生成自己的数据,尤其是在编码和数学等可以验证答案的领域,理论上可以产生无限数据。当然,这些都是研究问题。我们的优势一直是研究优先,拥有最广泛和深厚的研究团队。回顾过去十年的进展,无论是Transformer、AlphaGo、AlphaZero还是我们讨论的其他成果,都来自谷歌或DeepMind。我一直说,如果需要更多科学创新,我们有能力做到,就像过去15年的许多重大突破一样。情况确实如此。我其实喜欢挑战更艰巨的领域,因为这不仅需要世界级的工程(已经非常困难),还需要结合世界级的研究和科学,这正是我们的专长。此外,我们还有TPU等长期投入的世界级基础设施优势。这种结合让我们能站在创新和扩展的前沿。实际上,我们大约50%的精力用于扩展,50%用于创新。我认为要实现AGI,两者都需要。","question":"去年此时,很多人谈论扩展最终会遇到瓶颈,比如数据耗尽。但现在我们录制节目时,Gemini 3刚刚发布,在多个基准测试中领先。这是如何实现的?扩展不是应该遇到问题吗?"},{"answer":"我认为可能存在。我们现在试图构建的更像AlphaGo。这些大型语言模型、基础模型从人类所有知识(比如互联网上的几乎所有信息)出发,将其压缩成有用的成果,以便查找和泛化。但我认为我们仍处于初级阶段,就像AlphaGo那样,需要在模型之上进行搜索或思考,引导有效的推理路径和规划思路,从而找到问题的最佳解决方案。目前我们似乎并未受到互联网等人类知识极限的限制,主要问题是还不知道如何像使用AlphaGo那样完全可靠地运用这些系统。当然,AlphaGo的情况更简单,因为它只是一个游戏。一旦有了AlphaGo,我们就可以像Alpha系列那样开发AlphaZero,让它自主发现知识。我认为这是下一步,显然难度更大。所以先构建类似AlphaGo的系统是不错的第一步,然后再考虑类似AlphaZero的系统。但如今的系统还缺少持续在线学习的能力。我们训练、平衡、微调这些系统,然后它们投入使用,但无法像人类一样在实际应用中持续学习。我认为这是AGI所需的另一个关键缺失部分。","question":"我还想到AlphaGo到AlphaZero的故事——当剥离所有人类经验后,模型反而变得更好。在你们正在创建的模型中,是否存在类似的数学或科学版本?"},{"answer":"实际上,除了AI,世界模型和模拟一直是我最长期的热情所在。当然,这些在我们最近的工作(如Genie)中融合在一起。语言模型能够理解很多关于世界的知识,实际上比我们预期的更多,因为语言可能比我们想象的更丰富,包含的世界信息甚至可能超出语言学家的想象——这些新系统证明了这一点。但关于世界的空间动态、空间感知以及物理环境的机械原理,很多难以用语言描述,也没有在文本语料库中体现。其中很多与经验学习(在线经验)相关。有些东西无法描述,只能亲身体验,比如传感器数据(如电机角度、气味等)很难用语言表达。我认为这是一系列相关问题。如果我们希望机器人工作,或者打造能在日常生活中陪伴你的通用助手(比如眼镜或手机上的助手),而不仅仅是在电脑上,就需要这种世界理解能力。世界模型是核心,它指的是理解世界机械因果效应、直觉物理、物体运动和行为方式的模型。我们在视频模型中看到了很多这样的能力。如何测试这种理解?看看能否生成真实的世界——如果能生成,说明系统一定包含了很多世界的机械原理。因此,Genie、VO等视频模型和交互式世界模型令人印象深刻,也是迈向通用世界模型的重要一步。希望未来能应用于机器人和通用助手。当然,我最喜欢的事情之一(肯定会做的)是将其重新应用于游戏和模拟,创造终极游戏——这可能一直是我潜意识的计划。没错。","question":"我还想和你谈谈模拟世界以及在其中放入智能体的话题,我们和Genie团队聊过。告诉我你为什么关注模拟技术。世界模型能做语言模型做不到的什么事?"}]}
原文:

评论

登录后发表评论
×