王小川谈大模型格局:大模型降价卖的是云服务,AI超级应用会“像人一样”!
激石Pepperstone(https://www.paraat.net/)报道:
5月22日,百川智能发布最新一代基座大模型Baichuan 4,并推出成立之后的首款AI助手“百小应”。
百川智能还宣布开放Baichuan 4,Baichuan3-Turbo,Baichuan3-Turbo-128k,Assistant API四款API,所有开发者、企业用户均可登录百川智能开发者中心选择并接入相应API,便捷高效地体验百川智能新一代模型的强大能力。
在媒体沟通环节,王小川分享了对AI超级应用、AI产品发展路径、AI商业模式、大模型价格战营销战、AI技术瓶颈、AI搜索格局等问题的思考与观点。
超级应用要满足刚需,DAU超3000万
当前百万DAU的AI应用远远算不上超级应用
媒体:很多模型公司都发布了自己的AI应用,有些甚至去年就发布了,现在发布“百小应”,会不会有些晚了?
王小川:其实我反倒觉得早了。
今天的大模型应用还需要更多时间的打磨,目前市场上的百万级DAU的AI应用远远算不上超级应用,之前发的各种应用只是模型的展现。
对我们来说,我们之前有输入法、搜索引擎和浏览器的经验,知道一个应用到达什么样的状态的时候才会变成一个广泛被使用的产品,现在各家的产品状态都还没到。
今天发布的“百小应”,离我们心中要的也还有距离,但我们也需要有机会把它发出来,让行业端有基础的了解,也能让团队转起来。
所以不是早不早的问题,是整个行业都还没有到成熟的状态。
超级应用要满足刚需DAU超过3000万
媒体:如何定义超级应用,是不是要有上亿用户,预期是怎样的?
王小川:超级应用我认为要满足刚需,规模上还得再提升两个数量级。
这个不光是我们自己,行业内的各家也都没有达到。100万DAU不叫超级应用,从100万DAU变成1亿,上浮下浮3.3倍,得到3000万到3亿之间,我觉得这个叫做超级应用。
ChatGPT我觉得还不算超级应用,如果OpenAI足够用心,超级应用它能做,以它现在的技术有机会,但它有自己的基因,没有往产品方向投入太多精力。
从超级应用角度看,现在大家都没有到,但我们自己心中有这个画面感。
经过去年 4 月份到今年 5 月份这一年的时间,团队积累了足够的手感,做了大模型 AI、也做过超级应用,对于未来应用长什么样有期待。
在Baichuan 4和“百小应”发布后,节奏上可以真正走向“双轮驱动”的模式,朝前迈进的时候会有里程碑,总得有这个“1”迈出去,使大家有经验和有试水,能把两种信息都融汇在一起,能使这个团队走得更健康一些。
超级应用要在模型提升之后出现,百川也有应用端的储备
媒体:此前有观点不太看好同时做模型和做应用的创业公司,百川为什么要“双轮驱动”?
王小川:我的基本判断,同一代模型,百川更有机会把超级应用做出来,并能做到最好——超级应用要在模型有一定提升之后才能做出来,我们也有自己应用端的储备。
每一家选择的路径不太一样,有的是先把模型拱起来,也有的是去做应用。
上海有家做模型跟应用做成两个公司,我觉得可能会出问题。
模型和应用平衡,是每家公司最顶层战略要考虑的问题。模型是模型,应用是应用,模型做大了不代表应用做好。
超级应用可靠性高、能与用户对话,像人一样是AI发展的路径
媒体:如果“百小应”想要成为一个超级应用,它应该具备什么样的特点?如果想让用户用起来,它应该切中用户什么样的诉求?
王小川:首先可靠性得高。
今天模型在用的时候可能是60%、80%的可靠性,有时候灵,有时候不灵。
还有些基本的必要条件,在可见的未来里模型一定要跟搜索做结合,因为模型是一个推理引擎,它对知识了解度不够,有了搜索之后,使得它的知识的广泛程度和真实度能得到提升,这是一个基本条件。
第二是能跟用户对话,有充分理解用户意图的能力。
如果想成为用户的助理,一定要知道用户想要什么。继续往超级应用走的话,AI会更多像行业里的职业人士一样,而不是现在还是很泛的状态,什么都懂一点。
以当下大家关注的机器人为例,今天做机器人都有两个特点:
一个是做人形。
为什么做人形而不是滚轮的,这是很重要的一件事情;当做人形的时候才能帮它更好融入今天的环境,让它懂得怎么开冰箱门,怎么坐电梯;做其他形状的时候,它没法和今天的物理环境进行很好的互动。
第二,它的学习样本要来自现在的人类社会,像人一样的工作,也要像人一样做学习。
如果你想做AI的炒菜锅和AI炒菜机器人,以前的逻辑一定是做AI炒菜锅,今天做一个会炒菜的机器人比做一个炒菜锅更容易。
因为炒菜机器人有大量的数据可以学习,看人是怎么炒的,要做炒菜锅还要有额外的设计。
因此,像人一样工作,像人一样学习,这件事情是AI发展的路径。
最后就会变成一个职业人士,往下会变成AI律师,AI医生,AI HR,这种情况下我觉得就可能变成超级应用。
现在谈商业模式为时过早,“从工具变成伙伴”,Kimi的打赏很惊艳
关键要有超级应用
媒体:关于C端的商业模式,除会员、广告等外,AI应用的商业模式是否会有本质区别?
王小川:我觉得现在谈商业模式过早,包括Kimi,现在有足够的用户价值,有足够的体量,不管是走流量模式,还是广告模式都会有意义。
现在这种探索没问题,但我觉得有或没有,其实没有本质区别。
媒体:ChatGPT、文心一言都有收费版本,百川未来会不会走类似的变现路径?
王小川:这不在我们考虑当中。
文心一言,我觉得它还没有百度文库的收入多。
今天API和模型本身的收入,都不叫成功实践,不是我们要追赶和类比的情况,在今天也不是最性感的商业模式,文心一言和ChatGPT都不是。
关键是要有超级应用,解决用户的痛点;然后收入来讲,我持毫无疑问乐观的状态,但现在谈收钱这件事情好像意义确实不大。
Kimi的打赏很惊艳很惊喜,百川提出“从工具变成伙伴”的概念
媒体:如何看待 Kimi 最近推出的打赏模式?打赏之后下一步会是什么?
王小川:我觉得挺好的,就应该把AI像人一样去做,我觉得这是正确的商业理念。
刚才提到大模型是一个新的物种,以前做超级应用大家的路径老想做工具;去年我们提一个概念“从工具变成伙伴”,这个概念大家应该接受的比较多。
有两个例子,年初的时候一个大公司的高管跑来跟我们聊,说大模型不靠谱,七位数的乘法都不会做。
你要是(把它)当成计算机,七位数的乘法不会做那是很闹心的,但是人也不会。在座的各位,我相信没有一个人能把七位数的乘法做出来。
我们要把大模型当成人一样思考,而不是把它当机器一样思考,你要是当机器,调用计算器就行了,要当伙伴来想。
Kimi搞了打赏,很惊艳、很惊喜,同样的理念,不是当成工具,不是为工具买单,而是当成一个伙伴,当成一个人。
Kimi和它的朋友,累了休息一下。
整个路径里面强调未来新的超级应用不要把它当成工具用,而是伙伴来看。
这是我们去年提到的能产生陪伴,有知识,有经验,并能提供服务的概念。
往下我觉得商业是跟着产品价值走,价值到了之后,打赏付费能起来,否则再怎么规划场景也没用,用户都不用。
大厂降价倒逼市场理性选择定位,To B服务降价后卖的是云服务
To B服务,大模型降价卖的是云服务
媒体:如何看待最近由DeepSeek带起的,各家大模型厂商参与的大模型降价的行为?
王小川:之前提到过,我认为大模型厂商一定要有自己的超级应用。
如果只是学习OpenAI,有个模型,然后做API的服务,对于创业公司来说,在中国是走不通的。
一方面是因为在国内的商业环境里,ToB的市场比ToC小十倍,To B传统公司确实做得更大。
另外,可以预见到API这块大厂肯定来卷,这都是他们的射程范围内的。对于创业公司来说,只靠价格低,竞争力其实是不够的。
所以第一天就要双轮驱动“超级模型+超级应用”,这是充分必要条件,不能只有应用没模型或者只有模型没应用。
对于降价行为本身,我觉得是大家都太看好这个时代的前景,不愿意失去任何机会,宁愿零价格也要入场。
第二,降价我认为核心要看你的商业模式是什么,如果你是做To B服务的,降价最后卖的不是模型本身,卖的是整套云服务,所以云厂商是比较偏传统的服务模式,进到一个新的战场,这次降价仅限于云服务厂商的动作。
这波降价跟之前的滴滴美团降价还不一样,因为那时候的价格战或补贴背后带有网络效应,是双边的网络;商业模式在改变生产关系,司机和乘客的关系,外卖员和用户之间的关系,所以那个是建立双边网络效应。
而这次降价是B端的降价方法,而不是像滴滴美团这样的价格竞争,我觉得这并不像C端;这次不是生产关系改变,而是直接做生产力供给,将AI直接供给生产力。
我觉得这件事情对我们而言,就是别掺和进去。现在跟我们没啥关系,我们的超级模型也不是对外服务;但一定要做差异化,所以战略上更坚定走双轮驱动的模式。
大厂降价,倒逼市场理性选择定位
媒体:有观点认为,大模型价格战会让国内To B商业模式彻底失效,或者天花板拉得更低,你怎么看?To B还能赚钱吗?
王小川:我觉得就像原来的滴滴美团,这会刺激整个To B市场更快繁荣,大家会更愿意尝试使用,有价值空间,只是看被哪个公司赚走了。
涨潮退潮最后才会有珍珠,一定有泡沫在里面,价格战会使得泡沫反而变得更加繁荣,并不是没泡沫就是好的状态。
在之前的泡沫里面,很多公司觉得自己得去训练模型,这是不健康的,市面上不需要那么多的模型提供方,不需要千模大战、万模大战。
随着有越来越多开源和低廉成本闭源模型,每个厂商要更清楚知道定位,到底是做应用还是自己做模型,还是模型应用一体化,会让大家更加理性。
之前大厂很恐慌,现在好很多,尤其是大厂这么做贡献,会使得To B应用繁荣得更快,但会有一些没想清楚的公司退出去。
技术进步带来推理成本下降
也许今天亏钱,再过一年就不亏钱
媒体:价格战背后也有成本下降的因素,应用还没起来成本就下降的原因是什么?
王小川:推理成本是否下降跟用户规模没有什么关系,更多还是技术的进步,包括底层GPU,算力层、infra的建设和模型联动,所推理成本指数级的下降确实是技术进步带来的一件事情。
今天大厂降低token价格,我相信大厂也预期未来模型成本会降低特别多,也许今天亏钱,再过一年不亏钱;这种情况下,大厂商并不会考虑短期亏损的问题,而是考虑未来预期有没有机会模型降到足够的便宜。
我觉得大家对模型降价本身也有推理成本的降低的预期,就是因为技术进步。
营销战猛烈和融资需求有关
百川有足够的资金更专注产品
媒体:现在各家除了打价格战,营销战也蛮猛的,你们的应用也出来了,会不会有类似的打法和策略?
王小川:可能不太一样,因为我知道现在各家有的为了获客,1个用户200块钱,还不说获客之后提供服务的费用。
我觉得这只是竞争过程中大家为了能赶快出去,能尽快拿下下一轮融资的举动,我认为并不是健康的行为。
因为百川也会公布我们融资的情况,我们手上有足够的资金,我不是通过立马发一个东西出去,这种不健康的状态,去拉下一轮的融资。
因此我们会走得更健康一些,会把我们的精力在产品价值的体现,我们认为我们团队是有足够多的历史经验的。
什么是好的产品,好的产品出去之后一定会得到用户认可的,跟今天的同行是不一样的,这个产品发布之后,肉眼可见会进入后一个时期。
除了长文本还要强调推理能力,GPT-5延期,是否技术瓶颈看年底
传说中的GPT-5有一些Delay,是否遇到技术瓶颈年底才看得出来?
媒体:未来百川新的模型发布节奏延长到每个季度,在百川看来无论是国内还是国外的公司,大模型技术方面是否遇到更大的挑战或瓶颈,前沿的探索是不是变得更难了?
王小川:我们去年提了一个概念,理想慢一步,落地快三步,这是针对美国的提法。
其实在模型探索当中,从0到1的突破,美国从资金的储备也好,还有他们科学家的文化也好,都比国内强很多,所以在探索的道路里确实成本会很高。
可以简单讲,每一次重大的技术突破都是美国引领的,他们做到了,我们再去跟,在模型上有GPT-4、GPT-4o的发明之后我们再去跟,使得我们能大大降低国内成本的投入,这样能把精力更多放到怎么能把用户端做好,所以在国内的区别是需要做平衡。
大模型的瓶颈,至少在我心里,Sora和GPT-4o不代表最大的突破,传说中的GPT-5有一些delay,到年底才能看得出来。
长文本之后,还要更强调模型内在自洽性和推理能力
媒体:如果长文本卷到无限长以后,还有什么方向可以发展?
王小川:还有推理能力,做数学题,或者能有更多的思考。
今天的模型自洽性都不够,模型思考的严谨性,有足够好的逻辑,都是更加重要的事。
我倒不觉得长文本是它唯一的事情,现在国内也知道模型长文本很重要,但是它只是做大的必要条件,不是充分条件。
在充分条件里,我认为模型本身要更强调内在的自洽性和推理能力,这两件事情并不是能靠长窗口去解决。
相比多模态百川更关注文本能力
多模态还没有智力
媒体:百川未来在多模态上有什么样的规划?
王小川:相比多模态,百川更关注于文本能力,我觉得多模态还没有智力。
这次大模型主要是语言智能的突破,感知和认知。
符号本身就是对世界建模的过程,且已经尽可能把人类对世界的认知积累下来,语言在这里面就是对世界进行类比的过程,是认知过程本身。
但今天语言用着用着可能没数据了,开始探索能否在图像、视频里面产生智能。
在学术界也都没有跑通,机器还没有足够智能,能自动发现规律,因此语言基本和智力是等价的概念。
包括AlphaGo、Stable Diffision,都是对世界规律的复现,不是代表智力认知活动。
AI发展之后,百度的搜索份额还会被抢
媒体:如何看待百小应和秘塔在搜索结果呈现上的差异?这种差异是技术上的设计造成的,还是说有其他的原因?
王小川:我们的应用分粗读和精读,粗读的东西背后搜的网页更多。
它之前一直在看东西,但是显示出来是少的,是它认真读的。没把粗读的东西放进来。
第二块可以对比搜索效果,当你提出问题看看结果怎么样;读更多文章本身不是技术瓶颈问题,还是技术理念和产品实现的选择问题。
媒体:如何看待生成式AI给搜索带来的机会?AI跟搜索结合是百川的方向吗?
王小川:搜索在国外国内的现状不一样,国外Google绝对是老大哥的状态,国内百度是不断被抢份额的状态。
最早购物被淘宝做了,旅游是携程,生活经验是小红书。
再往下,AI发展之后,在大的趋势里我觉得依然可能是百度搜索被抢份额的状态。
如果仅仅使用模型来对搜索做总结,我认为这种做法在价值创造和竞争力方面,是走不出大厂射程的。
对我们而言,需要两件事情都做,自建搜索能力,同时也得有数据能力。
技术成本相对可控,现在最大的成本是Scale Up,大模型实验加上Scale Up,远大于其他地方。