
突破创新者窘境,要杀掉“现金牛”
《中国企业家》:见面之前,我在万知上提了一个问题:李开复博士再创业,成立零一万物,他最兴奋和最焦虑的是什么?它的答案是,最兴奋的是能够在AI领域继续探索和创新,最焦虑的是公司能否保持创新的能力,你怎么评价这个答案?李开复:前半句是完全正确的,我们现在面临人类有史以来最大的技术革命和平台革命。后半句从一定层面来看,零一万物的创新能力,除了要看CEO,更要看核心技术产品团队是否足够优秀,以及是否形成了内部创新机制。作为CEO,我延揽到了谷歌、微软、阿里、华为、字节跳动等一线大厂的顶尖技术产品人才。同时,作为CEO,我也负责制定创新战略,比如我们会根据每个阶段重要的技术产品进行创新攻坚,成立“war room”(作战室)——跨部门调取骨干,又快又好地把当前战略级的技术产品项目从0到1再到100地做出来。我们已经在多个技术产品应用了此机制,成效良好。5月21日在世界权威盲测LMSYS上取得领先成绩的Yi-Large模型就出自“war room”之手。war room也会不定期内部分享最新进展和前沿技术,某种程度也成为创新脑暴和交流的场合。比如零一万物的“模基共建”“模应一体”等战略也都在war room得到有力实践。《中国企业家》:所以大模型的答案可能未必跟你的想法是完全一致的,但这也是它的特色?李开复:我觉得这是大模型最有魅力的地方。它就像一个人,做它的人也不能预测它会怎么回答,很多人可能会以为AI大模型是你输入进去想要的回答,事实上我们没有输入任何一个答案。我们输入的是它思维的方式和学习的语料,还有它表达的方式,其他都是它做主,不是我们做主。《中国企业家》:北京时间6月11日,苹果发布了人工智能的应用,你怎么评价?李开复:我觉得苹果是一个非常让人尊敬的公司,它专注用户体验,找了一些切入点,非常聪明地在Siri和搜索上,都很好地用上了AI功能,一定程度跟微软的copilot有异曲同工之处。两个公司都是很重视技术,并嵌入了已有产品。我个人会更喜欢做一些颠覆的工作,怎么能把微软office颠覆掉?怎么能把苹果手机颠覆掉?当然苹果可能也在做这件事,(现在)它肯定不能在手机还没进步时,就颠覆自己的手机,但我觉得每一个技术时代的来临,应该基于这个时代的特点彻底颠覆过去的产品。今天语音可以控制机器,而且可以随身随时随地立刻说立刻反应,机器能马上知道该帮我们做什么事情,这样的一个设备难道不应该更是一个项链、手表或者戒指,你说一句话,新设备能直接执行了吗?用手机来交互的方法难道不应该再颠覆吗?如果说苹果的发布,是一个按部就班的大模型在已有产品上的发布,我会更喜欢OpenAI的GPT-4o。《中国企业家》:我看到很多技术专家对这场发布会也有类似评价,认为颠覆性不够,苹果不应该是基于和ChatGPT合作出这样一个智能套件,它应该做自己的大模型,或者说3年之后它不应该在别人的地上来盖房子,所以您是认同这个观点?李开复:它采取了一个最保守的做法,虽然我觉得做的也是非常不错的东西,但是真的没有(满足)我们对苹果应有前瞻性(的设想)。话说回来,我们也要考虑,当一家公司大部分的收入来自一个产品,它还没有巩固这个收入,就把自己颠覆掉了,我觉得没有几家公司能做得到。同样的理由,微软没有说要推翻Microsoft Office,而是要增强它。其实我觉得微软是绝对有认知和能力去颠覆它的,但是一颠覆财报就不好看了,所以这就叫创新者的窘境。你是过去的创新者,你在上一代或者上两代是绝对的技术龙头,新的技术出来了,你不敢去拥抱新技术,因为你拥抱了,就会把过去的现金牛给杀掉了。但是我觉得一个公司应该充分了解,你不杀你的现金牛,也有别人来杀,所以应该更激进地来做。但是要杀的话,你就要考虑到财报和股价。李开复:真的能做到这样也不是完全不可能。腾讯能够用微信来颠覆了自己当时的现金牛——QQ,还是很了不起的事情。《中国企业家》:从5月以来,各大互联网公司开启了大模型“价格战”,你怎么看这个现象?李开复:我觉得媒体过度宣传炒作了这个概念。什么叫做价格战?第一个现象就是有些公司发现它可以用更低的成本做出一样好的结果,既可以赚钱,效果又更好。那为什么不把它分享给更多的用户?第二就是别人打了价格战,我也要跟风,我来降价,这就有点无聊了。有些公司宁可赔钱也不能高于别人,那更没意义了。还有第三种,我有好几个产品,最好的产品不怎么降价,最差的产品降很多,甚至降成0,也不是很有意义。李开复:对。比如去一家烤鸭店吃饭,烤鸭价钱没有降,但是果汁一毛钱一杯,你也不会去这家烤鸭店,又不是去喝果汁的,果汁降价并不产生我消费的欲望,只是一个吸人眼球的做法。《中国企业家》:我印象中你应该算是第一个说要反对价格战的,这是基于什么考量?李开复:也不能说完全反对价格战,因为推理成本、API成本的下降是整个行业急迫需要的。为什么今天没有井喷式的应用?为什么没有每个移动应用都用大模型?是因为大模型和其他技术不一样,背后要用GPU。GPU很贵,所以它不像移动互联网时代的边际成本是可控的,它的成本是很高的。我们用GPT举例。GPT-4如果今天是白菜价,应用一定会井喷,但它价钱很高,要等GPT-5出来,GPT-4或许会降到现在GPT-3.5的价钱,这时候GPT-4的应用就会井喷了。我们完全可以期待推理成本、API成本价钱每年降10倍。我觉得不要赔钱地去推,这会把整个行业秩序破坏了。第二就是不要忽悠人家,把一个根本不能用的模型降到一分钱、零分钱,没有任何意义。人家一用发现这么差,浪费了大家的时间,也耗了你的算力,何必呢?所以我觉得要看动机。如果是因为推理成本下降,能在赚钱的前提下把模型开放给更多人使用,这种情况是行业所乐见的。我们的Yi-Large性能对标GPT-4,但是价格是GPT-4的四分之一;如果想要实时搜索,我们有Yi-Large-RAG,如果想追求极致性价比,我们也有Yi-Large-Turbo;如果想大规模接入大模型,我们有Yi-Medium。我们的模型性能和定价本身就具备市场竞争力。但这背后的逻辑不是我们要比价,而是我们的推理成本足够低。《中国企业家》:通过用更优质的数据来训练,包括采用MoE(Mixture-of-Experts,混合专家)模型,是不是也能够降低推理成本?李开复:是的,我觉得数据本身是带来更高的推理能力,过的数据越多,用的数据越好,模型本身会提升价值,但是推理未必会变得更便宜或更贵。推理成本的下降可能会来自几个方向:MoE是一个非常好的方向,我觉得它有望让推理成本阶梯式下降。第二个是比如说搜索引擎以前那么贵,后来变便宜了,其实就是看你搜什么,搜很简单的东西,我就没必要去动用那么多索引,快速给你个答案就可以了。比如说今天天气怎么样,北京离上海有多远,这些问题没必要用大模型,也没必要用很复杂的搜索索引,就先把最便宜的问题用最低的成本回答了,再逐次用越来越复杂的,这样平均成本也会降低。第三种方法就是我们可能要把模型做各种压缩,在参数、比特数等方面进行压缩。第四种方法是硬件的成本,现在大部分硬件还是用英伟达的芯片,那就很贵,更便宜的芯片会带来成本降低。最后第五种方法就是当你设计整个流的时候,API的设计、推理引擎的设计、模型的设计、AI Infrastructure(基础设施)的设计,还有要采用什么芯片的设计,这5件事情应该是大家一起讨论,达到5件事情的整体最优。零一万物很独特的地方是我们除了有世界领先性能的Yi系列大模型,我们还有一个世界领先的AI Infrastructure团队,我们会跟多个GPU巨头沟通讨论,我们还有自己的应用。所以我们可以贯穿起来,用自己的应用、模型、Infrastructure,挑选出最优的芯片,做一个最佳组合,再拿出去提炼出模型和API,从而使成本下降,让别的APP也能享受到。