原文总结:
{"highlight": [
{
"question": "说到人的激励,你和联合创始人彼得的关系很特别。你们是如何走到一起的?11Labs的想法是怎么来的?真的是受糟糕的电影配音启发吗?",
"answer": "确实是这样。我们创办11Labs的契机有两个,恰好同时发生了。一方面,在创办公司前几年,他在谷歌工作,我在帕兰提尔工作,我们会利用周末黑客马拉松一起做项目,探索新技术——比如有个项目是推荐系统,在加密货币热潮时还做过一个加密货币风险分析工具,但效果不太好,实现起来也很复杂。后来我们做了一个音频相关的项目,想法是“能否分析你的说话方式,并给出改进建议”,这让我们看到了音频技术领域的潜力。同年晚些时候,在波兰的一个瞬间让我们突然意识到:哇,这里的电影依然是配音版——不管原片角色是男是女,全都由一个人配音,用平淡、毫无感情的语调念旁白,简直就像有声书在念电影台词,体验糟透了。结合我们在音频技术方面的积累,我们知道“这一定能改变”。想象一下,几年后技术进步了,所有配音都能保留原片的情感、语调,听起来会非常棒。这个想法就此萌芽。当然,要实现这一点,我们需要先解决底层研究问题。于是我们从11Labs的创意平台起步,后来又扩展到智能体平台——现在语音正成为我们身边技术的重要交互界面。不过你说得对,最初确实是从配音问题出发,后来才扩展到语音领域的方方面面。"
},
{
"question": "我之前和安德鲁·里德聊过,昨晚我们还好好聊了聊,他说“问问他为什么OpenAI做不到这一点”。我记得和我的合伙人基兰也聊过这个问题,当时我们没合作有两个原因:一是他提出的投资金额比较小(当然他很慷慨),二是当时太早了——无意冒犯,但两个年轻小伙子在伦敦做这个,OpenAI怎么会做不到呢?你怎么回答“为什么OpenAI不会直接做这个”?",
"answer": "他们肯定会有所行动,但我觉得他们缺乏我联合创始人和团队所拥有的那种天赋。不过更全面的答案有三点:第一是专注。特别是早期,AI领域有太多方向可以选,我们赌的是“要在语音AI的研究和产品领域做到极致”,所有工作都围绕语音展开。第二,全球在语音领域顶尖的研究者其实非常少,可能也就50到100人。彼得组建了这个领域最顶尖的团队——我们大概有5到10人能排进全球前100,这支团队太强大了,我每次都为他们的能力感到惊艳。具体来说:我们的文本转语音技术已经颠覆了行业;语音转文字在基准测试中打败了OpenAI和Gemini;现在的音乐生成技术也是大公司都没攻克的。这支团队真的很厉害。第三,就算OpenAI真的开始研究语音(我觉得他们可能在尝试),产品层才是关键优势。比如在创意场景中做旁白、配音,你需要大量后期调整才能做到完美,我们在这方面做得很好;如果要做语音智能体或对话智能体,你需要知识库、集成功能、部署测试工具——这些都需要平台支撑。而OpenAI在这方面投入不够,他们有能力但没这么做。所以,强大的研究团队、执行力和对具体用例的深度聚焦,这三者结合就是我们的优势。"
},
{
"question": "你觉得我们已经到了“规模定律不再等同于同等水平进步”的阶段吗?",
"answer": "我可能有点偏见,但我觉得AI的发展才刚触及皮毛——现在正是AI在各个领域加速渗透的“起飞期”,而规模定律依然有效。"
},
{
"question": "安德森把你介绍给了各位名人,你还认识了纳特和丹尼尔——人工智能领域最聪明的两个人,他们在用别人都不会用的API。美国的风投是不是和欧洲的风投玩法完全不一样?",
"answer": "我们很爱我们的合作伙伴。我的意思是,安德森团队真的太不可思议了。他们可不是在摸鱼。现在红杉资本的安德鲁团队更是另一个级别的传奇团队,也帮了我们超多忙。NEA2也一直超给力。但他们全都是美国的,全都是。所以我觉得他们确实在玩另一套游戏。就我们目前的经验来看,他们普遍更愿意承担风险。你知道的,我们聊天时他们总是想着“怎么才能下更大的注”,而不是“怎么规避负面影响”。我和彼得每次引进新合作伙伴时(除了资本和人脉品牌之外),一定会做的背景调查就是:如果你和这个人合作,要是项目不顺利,他会怎么做?所以我们通常会去打听,当公司陷入困境时,这些合伙人是怎么表现的。我们接触过的美国投资人在这方面都非常正面——公司不顺的时候,他们反而比顺的时候更支持创始人,真的在帮创始人。我也用同样的方法调查过其他公司,可能美国这边公司起起落落太常见了吧。但我们聊过的一些欧洲投资人,这方面的反馈就不太好。我和布莱恩·金有过一次不太愉快的经历,但不得不说布莱恩真的很棒。他是那轮融资的领投方,还帮所有人拿回了钱,这太少见了。他真的花了很多功夫,又快又好地解决了问题,我对他印象特别深刻。没错,就是布莱恩。他在我们的背景调查里得分很高,詹妮弗也是。他们都超赞。"
},
{
"question": "账上有1900万美元,大多数人会突然开始疯狂招人,不是招两个人那种,而是大规模扩招。但你却偏爱小团队。你之前跟我说过,卢克也跟我提过。为什么你这么喜欢小团队?",
"answer": "我觉得首先,人多往往解决不了问题。要做出特别的东西,根本不需要那么多人,这是第一点。第二,保持精简的组织架构——我们现在有250人,但其实更像是20个可以独立推向市场的小团队,每个团队5到10人,负责具体项目,他们有更高的主人翁意识,行动速度超快,能很快看到结果,然后根据实际情况快速迭代改进。我觉得这种模式真的太赞了。当然,这也有其他挑战,但……这些团队是按职能还是按项目组织的?有点取决于产品领域。比如我们有个团队负责工作室界面,他们要管用户登录后的所有核心体验;有个团队负责整个语音助手套件,里面又分了一个小组做企业级组件,另一个小组做自助服务功能。所以所有团队都是按产品领域来分的。其他部分我们也分得很细,比如有专门的人才团队,还有人事团队,他们执行的时候自主权都很大,这很有帮助。"
},
{
"question": "现在很多技术都在同质化,你觉得 execution speed(执行速度)是决定成败的核心差异,还是研究质量、GPU 访问权限?你怎么看?",
"answer": "我觉得两者都是。我们公司的做法是,把研究、产品和生态系统(包括分销和品牌)结合起来。研究对我们来说是先发优势。我们在研究上投入,以后也会继续投入,我们想在语音技术的各个方面都做到最好。但这只能让我们比竞争对手领先一年、两年,最多三年。你觉得你们比竞争对手领先多少?看具体用例吧,我觉得六到十二个月。取决于我们所在的领域。"
}
]}