Synthesia CEO:缩放定律为何难以为继 | OpenAI、Anthropic、X.ai 三国杀:谁将胜出及深层原因 | 模型提供商将深入应用层多远 | 模型终局:百花齐放的专业模型还是寥寥无几的通用模型 87

原文引用:
我的意思是,我认为我们现在绝对处于泡沫之中,对吧?人工智能产品领域将会有大量资金打水漂。我在企业中经常看到的情况是,买家并不真正知道自己想要什么。真正的信号不是你签订了合同,而是续约。这里是由我哈里·斯特宾斯主持的《20VC》节目。大约六七年前,有一位丹麦企业家走进我的办公室,向我展示了他对未来的愿景。我当时没有投资,这让我夜不能寐,是我最大的遗憾之一。如今,这位企业家来到了我的访谈现场。他的公司现在价值数十亿美元。让我们欢迎维克多·里帕尔贝利,Synthesia的首席执行官兼联合创始人——Synthesia是全球领先的企业级AI视频通信平台。截至目前,维克多已从Excel、GV、NEA等机构筹集了超过2.5亿美元资金。而且你知道吗,现在有超过100万用户和55,000家企业喜爱并使用Synthesia。
市场空白:
https://www.thetwentyminutevc.com/victor-riparbelli
原文总结:
{"highlight":[{"answer":"那是在2017年,现在想想已经是很久以前的事了。简单来说,当时我们一群人有了一个想法:生成式人工智能——那时候这个词还不是大多数人都会想到的——将会改变我们创作内容的方式。当时的重大转变在于,2017年,当大多数人想到人工智能时,想到的是数据分析,对吧?是做决策。那算是人工智能的一个时代。但当时已经有了早期的生成对抗网络(GANs),本质上是一种能够生成新数据而非仅仅分析现有数据的神经网络。我们认为这将是一项改变世界的技术,它会改变我们所知道的关于视频、语音、音频、音乐等所有内容的创作方式。但我们当时专注于视频领域。我带着一份很棒的PPT和我们自认为很棒的愿景去接触外界。但可以理解的是,大多数人觉得我们简直是疯了,对吧?我们当时基本上是这样对外宣传的:看,10年后,你只用一台笔记本电脑,仅凭想象力就能制作出好莱坞电影。这个宣传点并不怎么奏效,尤其是在欧洲。我们当时的总部在伦敦。因为我觉得在欧洲,风投行业仍然由那些曾在私募股权行业工作过的人主导,他们的思维方式与技术人员截然不同,对吧?所以,如果你曾在私募股权行业工作,你更像是一个金融家,而不是技术人员。他们无法从Excel表格的角度理解我们的项目。所以我们被几乎所有人拒绝了,我想大概有八九十位投资者吧,其中还包括一些播客主持人。当时你们想融多少钱?首轮想融100万美元。最后我们以500万美元的投后估值完成了融资,投资方是马克·库班,我们当时给他发了……马克是按1(投前)对5(投后)投的吗?对,1投后5。以现在21亿美元的估值来看,他现在大概持有15%的股份,差不多那个比例。哇哦。然后你们后来想融700万美元,是吗?那是之后的一轮融资了。回到2017年,我们以500万美元投后估值融了100万,这让我们得以启动。之后的12到18个月,就像通常那样,我们进入市场。当时感觉我们已经有了可用的技术。我们那时专注于AI配音,而不是我们现在主要做的虚拟人技术。我们又学到了惨痛的一课。你知道,我们当时想:‘好,我们已经开发出了这么棒的技术,我们是个很棒的团队,融800万美元吧。’结果彻底失败了。之后大概有九个月的时间,我们举步维艰。作为创始人,我犯了所有可能犯的错误。我把融资过程拖了九个月,涉及不同的数据点、不同的投资者,简直一团糟。由于资金快用完了,我们不得不退缩,最终只融到了310万美元。这笔钱帮助我们撑到了A轮,也就是我们真正找到产品市场契合点并拥有可持续业务的时候。但最初的两轮融资很大程度上是基于我们的故事。但当时那个故事并没有引起太多共鸣,因为人们很难看到我们当时所拥有的东西如何能发展成我们今天的规模。放在今天,以我们当时的团队和愿景,那轮融资本可以是500万到1000万美元,投后估值4000万到5000万美元。","question":"首先,这个消息太棒了,恭喜你。再次感谢你又在我面前炫耀(错失投资的事)。我想问你的是,我们之前其实聊过公司的融资历程。你能跟我讲讲吗?我知道这可能不在原定计划中,但我真的很感兴趣。你能跟我说说种子轮的情况吗?当时人们并不理解你们。到底发生了什么,情况是怎样的?"},{"answer":"我们经常讨论这个问题,我认为我们不会(像现在这样成功)。我觉得如果当时融到了800万美元,我们会做很多额外的事情,对吧?我们会尝试更多方向,比如建立深度伪造检测技术,当时所有人都希望我们做这个。记得那是在2018年左右,对吧?在那个时候,除了Synthesia团队内部,在其他人看来,AI视频就等同于深度伪造。人们认为深度伪造会成为大问题。当然,深度伪造确实是个问题,这是事实。但我们一直认为这只是AI视频的一个子集。大多数人会用这些技术来创作很棒的创意内容。但如果我们当时拿到了那笔钱,我觉得我们会组建团队去做深度伪造检测,那样我们就会失去焦点。事实上,我认为当时资金有限的状况反而迫使我们专注于客户和产品销售。我们从一开始就非常积极地向客户收费,哪怕只是500英镑,对吧?我觉得这种专注和在限制下工作的状态,无疑帮助我们找到了产品市场契合点。我非常赞同在限制下工作,我真的认为这能迫使你养成很多纪律性,而当你有更多钱的时候,这种纪律性很容易丢失,因为你有了更多选择,对吧?","question":"如果当时你们融到了那轮(800万美元)融资,而不是后来那些规模更小、更精简的融资,你们还会像现在这样成功吗?"},{"answer":"我的意思是,我认为我们绝对处于泡沫之中,对吧?但这不一定是坏事。我认为资本主义就是这样运作的:投入大量资金,开发大量产品,同时尝试无数种可能,然后看谁能存活下来。这是正确的创新方式,对吧?本质上是达尔文式的。但我认为很多AI产品的资金会打水漂,要么是因为它们价值不大,要么是因为它们最终会成为大型云服务提供商的功能之一。","question":"你认为人们对当前AI发展阶段最普遍的误解是什么?现实情况又是怎样的?"},{"answer":"我认为大公司肯定会有一定程度的集中。但有意思的是,像专业模型这类东西,本质上还是非常以技术为中心的。我觉得未来人们日常生活和经营业务时会用到各种各样的产品,其中很多产品可能会采用经过专门调优的开源模型,并将其集成到整个平台中。如果你把这看作是专业模型的话,那么没错,我们会看到很多专业模型。不过,科技行业总是没完没了地谈论模型,对吧?我觉得大多数人肯定还是会像现在使用ChatGPT之类的工具一样与模型交互。但作为消费者,当你使用别人的平台或产品时,很多后台工作流程其实也是由大型语言模型(LLMs)驱动的,只是你不会注意到而已。你肯定会看到很多公司构建自己的专业大型语言模型,但我认为我们更应该关注产品而非模型本身。","question":"你认为未来我们会拥有一个由众多小型专业模型组成的世界,还是会出现三个通用的大型模型呢?"},{"answer":"我认为从大的方面来看,互联网已经实现了内容分发的民主化——不再有 gatekeepers(守门人),任何人都能建网站,都能在网上分享内容,这真的非常强大。然后,在某种程度上,我们也看到了内容创作的民主化,因为现在我们的智能手机都有摄像头,摄影设备的价格也大幅下降。比如我们现在这个拍摄 setup(设备配置),要是在30年前,价格可能是现在的100倍。而现在即将发生的,是真正实现内容创作的民主化。我们将把内容创作的方式从‘需要通过物理世界的传感器捕捉’转变为‘能够完全数字化生成’,这将带来巨大的影响。文字作为社会的基本组成部分,我们可能没太在意,但文字的发展历程其实很有代表性:印刷术是文字领域最早的重大发明之一,后来我们发明了电脑键盘,现在文字已经完全数字化,无处不在,任何人都能在网上创作内容,这真的很强大。音乐领域也有类似的趋势,从依赖实体乐器演奏并录制,到现在可以完全数字化创作——如今大多数音乐不是用真实乐器制作的,而是用软件乐器,我不用真实乐器就能重新创作几乎任何歌曲,这从很多方面改变了音乐行业。我认为视频和音频行业也会迎来同样的变革:你只需要有想象力,就能将想法变为现实。这会带来很多影响,最明显的就是内容创作的成本将降至零——就像现在写本书几乎不用花什么钱一样。在不远的将来,单从技术角度来说,制作一部好莱坞电影的成本也可能降为零。这意味着内容会泛滥成灾,绝对的泛滥。但这也意味着像你这样的YouTube创作者,以及其他所有人,都能在内容呈现上与好莱坞竞争。现在,好莱坞制作的内容(比如我们看的网飞剧集,制作水准非常高)和YouTuber制作的内容(比如恶作剧视频、播客等有趣内容)之间还有明显差距。但即便是你,要制作一部好莱坞级别的作品也非常困难,因为成本太高了,对吧?而这种差距将会消失,这意味着最好的创意和内容终将胜出,我觉得这非常令人兴奋。","question":"说到内容创作的未来,这可是我的老本行,兄弟。你觉得五年后的内容创作会是什么样的?"},{"answer":"我认为像摄像操作这类纯技术岗位可能会逐渐消失。而创意、 storytelling(讲故事的能力)、亲和力等这些造就优质内容的要素,我觉得会比以往任何时候都更重要。比如现在的缩略图设计师或视觉特效师,哪些人会受到威胁,又会有哪些新工作被创造出来?我其实觉得,只要心态足够开放,大多数这类角色都能自然过渡到新的岗位。以视觉特效为例,我们之前聊过AI可以生成第一版素材,可能比随机生成的好,但远不如你亲自做的好。但‘你+AI’可能会非常厉害——比如对于一个两小时的剧集,AI能找出所有可能有趣的地方并展示给你,你可以自己选择。如果你是视觉特效师,你可能会像软件工程师一样,效率提升100倍。以前可能需要20个人才能做出我的数字克隆,现在你只需输入提示词就能控制生成,我觉得如果你擅长这个,在新世界里会非常强大。我认为未来的内容创作者会比现在多得多。就像互联网和电脑出现之前,很少有人能创作内容——20世纪30、40年代,大多数人不会创作文字内容,那是秘书和打字员的工作。现在我们所有人都在不断创作内容。我觉得AI融入日常生活的速度限制,其实不在于技术——我们已经有非常强大的大型语言模型了,能做很多很棒的事情,而在于人:人们需要使用、信任、付费购买并集成这些技术,这总是需要时间的。","question":"这种新的内容创作生态会如何改变内容行业的劳动力市场?我的意思是,哪些角色确实会受到威胁,又会创造出哪些新角色?"}]}
原文:

评论

登录后发表评论
×