原文总结:
{"highlight":[{"answer":"学术界对“智能体”的定义与当下工业界的理解有所不同,我认为这两种定义都很重要。首先,经典的学术定义中,智能体系统是指能够自主推理并采取行动的软件,这个概念源于“能动性”(agency)一词。由于学术定义过于宽泛,我觉得这个词对使用者来说有点像众所周知的墨迹测试——不同人有不同解读。目前在工业界,有三类智能体正处于实用化的临界点。第一类是很多人在网上热议的“个人智能体”,我认为这可能是三类中最早出现的,但也可能是最令人兴奋的一类。这类智能体可以帮你整理收件箱、规划假期、准备会议、管理日程等等。之所以说它最早出现,是因为相关演示很容易做,但人机交互以及智能体与我们日常依赖的各种系统的协同其实非常复杂。你可以想象,其推理能力和系统集成的覆盖面几乎是无限的,因此要打造优秀的个人智能体,可能需要比现有技术更先进的支撑。不过这个领域已有不少有趣的初创公司,你能想到一些公司会围绕特定细分场景深耕,随着技术进步逐步拓展业务。第二类智能体在某些领域已经存在,我称之为“基于角色的智能体”,它们专门负责特定工作。比如像Harvey这样的公司提供法律领域的智能体,还有各种编程智能体——目前有些编程智能体已经相当有效,能胜任程序员的部分工作。我觉得这很令人兴奋,因为这类智能体属于“窄而深”的范畴——任务范围和集成范围都比较明确。没错,它们能访问的工具以及效果评估方式都是清晰的:比如开发编程智能体,已有很好的基准测试;编译器会输出错误信息,还能进行集成测试。这些脚手架实际上在实践中缩小了实现目标所需的研究范围。总体而言,随着基础模型的出现,如今很多有效的AI应用都是将研究领域转化为工程领域。我认为在法律、软件工程等技术适用的特定领域,我们可以通过工程手段打造非常高效的基于角色的智能体。在我看来,个人智能体领域可能由苹果、谷歌、OpenAI等大型消费品牌公司主导;而基于角色的智能体领域,每个细分场景都可能诞生有意义的公司,因为要做好这类智能体,需要AI expertise与特定领域知识的融合。第三类是我所在的Sierra公司专注的领域,我称之为“企业智能体”。它不仅仅关乎自动化或自主性,更在于在对话式AI时代,企业如何实现数字化存在。我常打比方:如果回到1995年,企业的数字化存在意味着拥有网站并被收录进雅虎目录;到2025年,数字化存在可能意味着拥有一个品牌化的AI智能体,客户可以通过它完成所有在网站上能做的事——无论是咨询产品服务、进行商业交易,还是寻求客户支持。这个领域用现有技术就能实现,因为和基于角色的智能体一样,它不需要解决所有技术难题。企业的客户体验流程和业务系统都是明确的,核心在于:在从网站到应用再到对话式体验的演进中,企业希望打造怎样的对话式品牌体验。这并不意味着它很简单,否则我们也不会创办公司了,但至少目标是清晰的。我认为,如果你在研究通用人工智能,对“智能体”的定义可能不同,这很正常,毕竟那是另一个待解决的问题。但特别是在Sierra所处的领域以及你们投资的很多公司所专注的方向上,关键在于:现有技术能否抓住那些“准备就绪”的机会?我坚信答案是肯定的。","question":"如今的智能体(agents)真的能发挥作用吗?"},{"answer":"没问题。我先举几个具体例子来说明。比如你买了新的Sonos音箱,或者遇到技术问题(比如出现讨厌的橙色闪烁灯),现在可以和由Sierra提供技术支持的Sonos AI智能体聊天,它能帮你完成设置、调试硬件或Wi-Fi问题等。如果你是SiriusXM的订阅用户,他们的AI智能体名叫Harmony(我觉得这个名字很贴切),它能帮你升级或降级订阅套餐,或者在你购买新车获得试用服务时提供相关说明。总体来说,我们帮助企业构建面向客户的品牌化智能体。“品牌化”这一点很重要——它是品牌体验的一部分。这很有趣,也很有吸引力,因为就像回到1995年时,网站会印在名片上,那是企业首次拥有数字化存在。我觉得未来回顾现在的智能体,可能也会觉得“很复古”——就像通过Wayback Machine查看早期网站,要么只有一个电话号码,要么像DVD片头一样堆满花哨的 graphics。现在客户刚开始用的智能体往往聚焦于客户服务,这确实是个很棒的应用场景。但我坚信,三四年后,智能体将涵盖企业的所有业务。我之前举过一个例子,现在依然觉得很贴切:想象一家保险公司,客户能通过智能体完成所有交互——比如提交理赔、比较保险计划,或者像我们之前聊到孩子时提到的,当孩子到了可以考驾照的年龄,帮他们将孩子添加到保险中。所有这些都能通过智能体完成,这就是我们帮助企业构建的东西。Sierra最初专注于面向消费者的企业,绝大多数客户都是消费类公司。从技术角度看,B2B公司和消费类公司没有太大区别,主要差异在于客户数量。我总是从第一性原理思考:这项技术能实现哪些以前不可能的事情?比如想想传统对话的成本——现在打客服电话,大多数服务团队的关键指标之一是“每次接触成本”,即人工和技术投入的总成本,通常每个电话约13美元。而有了AI,这个成本可以降到1美元以下,相当于将对话成本降低了一个数量级。从数学角度看,哪些公司最能从中受益?显然,拥有数百万消费者的消费类公司价值完全不同。因为传统对话成本太高,很多消费品牌其实并不希望客户轻易联系自己——网上甚至有专门教你如何找到公司电话号码的网站。企业往往会把客户推向数字化自助服务,虽然这在某些方面对消费者友好,但本质上是成本驱动。现在对话成本降低了一个数量级,企业可能会将对话量增加一个数量级——这意味着什么?技术趋势通常始于数字化现有流程,但二阶效应可能是:既然对话不再是沉重的成本中心,如何将对话作为客户体验的核心部分?回到你的问题,与拥有100个客户的B2B公司相比,与大型消费类公司的合作在影响程度和决策逻辑上有很大不同。这并非说B2B领域没有价值,只是影响层面和决策差异很大。","question":"能否描述一下构建企业智能体的实际流程?比如研究与现实之间的差距是什么?作为工程团队,你们的投资重点在哪里?如何理解不同客户环境的范围?这些投资方向有哪些?可能这个问题有点复杂,但作为切入点,或许可以先定义Sierra目前为客户提供的产品是什么,未来的发展方向,然后再深入探讨其组成部分。因为显然你们在这个垂直领域已逐渐成为领导者,但为了让更广泛的听众理解,还是希望能明确你们的核心业务。"},{"answer":"不介意的话,我先从宏观市场视角谈起,再回到你的问题。马克·吐温有句名言:“历史不会重演,但总会押韵。”我认为AI市场将与过去15年的云计算市场“押韵”。回顾云计算的发展,最终形成了少数几家基础设施即服务(IaaS)提供商,占据了云计算资本支出的绝大多数份额——大多数软件即服务(SaaS)公司都要向AWS、Azure或谷歌云等基础设施提供商支付“租金”。这是因为数据中心建设存在规模经济,初创公司既没必要自建数据中心,也没必要打造IaaS业务——资本支出的要求太高,正反馈循环难以形成。我认为前沿模型(frontier models)的发展可能也是如此:最终会有相对少数的公司负责预训练(模型构建中资本密集度极高的部分)。这并非因为只有这些公司有优秀的研究人员,而是从资本支出回报的角度看,需要将模型租赁给大量用户才能收回成本。很多进行预训练的初创公司正发现,从数学角度看,实现投资回报的前景存疑。","question":"你认为AI市场将如何发展,与云计算有何类比?"}]}