原文总结:
{"highlight":[{"answer":"这是个很好的问题。我们很多人在这个领域研究了很久,但一直没创立公司,因为在不久前,这还只是个研究想法。虽然有迹象表明终有一天会成功,但那并不在公司的时间框架内,对吧?你不能抱着“十年后才会成功”的想法去创业,也不想等技术已经成熟再行动而错失良机。所以理想的时机是:我们有一两年时间真正把这件事落地。我们创立公司时就押注这会成功,有几件事推动了这个决定。首先,我们打赌结构预测(即蛋白质折叠)技术会大幅进步。显然,2020年左右蛋白质折叠问题被认为已“解决”,AlphaFold 2等突破使得以实验级精度预测蛋白质结构成为可能,但当时一次只能预测单个蛋白质结构。我们能获取单个蛋白质序列并看到其结构,这对基础生物学很有用,能帮助我们理解所研究蛋白质的形态。但说到药物发现(这是Chai Discovery的核心 focus),你需要理解多个分子间的相互作用——比如小分子药物如何调控蛋白质,或抗体蛋白如何调控抗原蛋白。我们开始看到这种相互作用预测的初步希望,并且打赌借助扩散模型和语言模型的突破,我们能把技术推向新高度。上一代结构预测模型一次只能预测一种蛋白质构象,就像早期的图像模型没有扩散模型,无法生成多样化的结果。我们认为这一变革同样会影响药物发现和蛋白质折叠领域。这就是我们决定创业的部分背景。最后还要提一点:几乎所有我们之前的AI生物公司都与实验室工作深度绑定,甚至绑定得太紧。实验室整合当然很好,Chai也做很多实验,但缺失的是能否打造一个可迁移的AI平台——一个具有通用性、能应用于多个领域的平台。如果能做到这一点,影响力就能提升到新高度。我们刚发布的Chai-2模型可以部署到数百甚至数千个不同项目中。我们开源的Chai-1已在行业内广泛应用于各类产品,甚至很多应用场景我们都不知情。如果要将生物学从一门科学转变为更像工程学科(这是公司的终极目标),打造这样的平台至关重要。","question":"乔希,你和团队里的几位科学家在不同机构从事AI药物发现研究已有约十年时间。我也关注这个领域十多年了。但目前我们还没看到通过这些AI计算技术设计的药物成功上市。是什么让你们相信这项技术可行?为什么选择在当时创立公司?"},{"answer":"当然。Chai-2是我们最新的系列模型,在多个任务上都达到了最先进水平,但我们最兴奋的是它的设计能力。我们已证明它能设计一类被称为“抗体”的分子——这是治疗领域最具潜力的分子之一,占近期药物批准的近50%,全球畅销药Top10中有7个是抗体。Chai-2的突破在于:针对目标设计抗体时,只需在一个“24孔板”中进行20次尝试。具体来说,我们输入目标,运行模型设计抗体,然后将抗体送到实验室,经过约两周的验证周期,会发现约20%的抗体能按预期与目标结合。这对行业是重大突破。项目启动时,我们全年公司目标的成功率仅定为1%——因为此前计算方法的成功率约0.1%甚至更低。而传统实验室高通量筛选需要筛选数百万甚至数十亿化合物才能找到一个有效分子。难怪我们称之为“药物发现”——这本质是个搜索问题,就像在巨大的酵母或噬菌体库中“淘金”。另一种传统方法是给小鼠或 llama 注射抗原,等几周让它们生病,然后取血浆分离抗体——新冠疫情时我们就是这么做的:从康复者体内提取抗体,寻找能中和病毒的那个。你可以想象,这不是最理想、最高效或最有原则的流程。而Chai-2将计算抗体发现的成功率提升了多个数量级(相比之前的计算方法),更是比传统实验室方法提升了无数倍。我们认为这对行业意义深远。一方面是“更快、更好、更便宜”——能加速药物开发;但更重要的是,它将解锁以往方法无法触及的全新靶点类型。当前生物技术行业整体有些低迷,XBI指数近五年表现不佳,可能是几十年来最糟糕的市场之一。但Chai-2让我们看到了生物技术真正平台性转变的早期迹象——这种转变几十年才出现一次(比如70年代的技术革新)。未来五到十年,我们将能发现全新种类的分子、解锁全新靶点、开拓全新市场,为患者带来治愈以往不治之症的疗法。这对我们来说是无比激动的前景。","question":"Chai-2取得了突破性成果。能用通俗易懂的语言解释一下成果是什么、模型本身以及你认为最有价值的部分吗?"},{"answer":"公司有两个核心投资方向。首先,模型输出的还不是药物,只是“命中分子”(抗体命中),要转化为可用于人体的分子还有很多工作。预印本中的早期数据显示这些分子具备很多理想药物特性,但需要更多表征和检测来验证。其次,下一步是直接从零样本模型生成完整药物候选物。几个月前这还像科幻想法,但既然20次尝试就能得到抗体命中,没理由不能用同样次数生成完整候选药物。这方面需要重点投资。目前模型只是模型,虽然有用,但产品可以更完善——优化治疗特性,构建软件界面,让其像Photoshop一样易用。如何在软件中指定“设计同时结合两个靶点的分子”?这需要先进的软件,随着发展会越来越复杂。我们还开源了Chai-1,当时视为模型;而Chai-2不只是模型,是产品,是一整套流程,使用难度也更高。蛋白质折叠只需输入序列输出结构,设计则需要精确的提示词——论文中我们通过编程实现大规模评估,但科学家启动药物项目时不会写脚本,需要精心设计提示词,所以产品层投资至关重要。随着支持更多药物形式、优化多种特性(如论文所示,同时优化人类和猴子靶点),提示词会更复杂。还要让模型从实验室实验中学习,成为设计的“副驾驶”,以及让抗体工程师接受新范式——这些都是我们当前的投资方向。","question":"从战略角度,Chai接下来会在哪些方面投资?你提到要在模型中设计其他特性,但作为AI模型公司,你认为其防御性在哪里?"}]}