「风再起时」圆桌对谈:AI创业者总容易对短期过于乐观,对长期又过于悲观|WAVES新浪潮2024

科技 2024-06-20 16:52 阅读:

价格战无疑是今年5月以来大模型领域的第一场热战。关于这场热战的讨论,同样绵延到了6月14日的36氪WAVES2024大会上。

在这场名为“风再起时”的圆桌讨论中,昆仑万维的董事长兼CEO方汉和澜舟科技合伙人、联席CEO李京梅,针对推理成本的降低是否可以带来应用的爆发,分别给出了自己的思考和判断。

方汉认为推理成本的下降并非是C端产品能否在全球发力的决定性的因素,因为“对最终用户来说,根本不关心成本,而只关心这个东西新不新,好不好”。李京梅同样认为“简单的降价对B端的企业来说,并没有大的影响,因为企业客户最重视的是效果。”

除此外,他们还谈及昆仑万维和澜舟科技在过去一年的一些选择与思考,以及整个AI的toc 和tob生态里,谁可能是最大赢家等话题。

昆仑万维和澜舟科技都是这波大模型浪潮中非常早的入局者,作为分别押注C端和B端两种商业模式的公司,他们的思考和判断恰好构成了当下AItoC和to B生态的一个完整切片。WAVES是36氪去年推出的全新峰会IP,今年已是第二届。

以下为圆桌内容,经36氪暗涌编辑:

提早入局带来的差异

暗涌:昆仑万维和澜舟都是大模型浪潮中非常早入局的公司,在ChatGPT火起来之前入局和之后入局可能带来的差异是什么?

李京梅:澜舟科技是2021年6月正式创立的实体公司,我们从创业之初就已经在做预训练模型,当时没有ChatGPT,在技术圈外大家不是太了解。当时的模型已经是基于transformer技术去做的预训练模型。我们的品牌一直也没有变过,从孟子预训练模型到如今的孟子大语言模型。

比较早入局有什么样的优势或者差异?相对综合来说,最主要的还是实践,澜舟科技一直是坚持技术创新和实践落地双轮驱动的方式,积累竞争优势。

这样做的好处是能够与客户在一起,不论是金融机构还是其他,我们在面向企业场景做落地时。不仅能够跟企业一起基于数据打磨模型,也可以了解模型面向企业真正应用的场景会有哪些不足,持续打磨模型和场景应用。在数据和应用场景实践方面的积累,我认为是早期入局带来的,到今天也是我们能做到差异化的优势。

方汉:我们公司2020年开始入局大模型,理由比较简单,因为我们是一家出海的公司,公司有90%左右的收入来自海外,而且海外主要做的是内容和社交平台。在2020年GPT-3.0刚刚出来的时候,我们马上意识到这是一个AIGC的里程碑,也就是内容生成方面的里程碑。

从那个时候开始做中文预训练大模型,从2021年开始做音乐大模型,2022年底发布第一个开源的中文13B预训练大模型。

我们做的时间比较长,我们思考的问题可能会比去年刚入局的同行多,因为我们毕竟花了三年时间在思考这件事。

思考的结果跟大家分享,不管是ToC还是ToB,AI本质上还是软件服务。既然是软件服务,就需要遵循正常的商业模式,就要看成本和收益怎样取得均衡,这是所有创业者都要考虑的问题。

我们在2021年、2022年开始对外推出AI产品,我们观察到一个现象,AI产品对最终用户来说,他们压根不关心产品是否是AIGC,是否是AI生成,特别是C端产品,更加关注产品的品质是否比其他的产品高,产品的形式是否更加新颖。这两年做到了,你才能拿到所谓的用户红利,而不是说简单的利用AI做个产品糊弄用户,他们就会买单,这是很重要的一点。我们和澜舟做的比较早的小优势,就是我们对商业模式和场景发展布局会有更多思考,但更多思考不代表我们一定是站在正确的一面,只能说我们思考的会比较多。

一些抉择

暗涌:两位去年6月也来过Waves大会,过去这一年,澜舟科技发生的最大变化是什么?有没有相对艰难的一些抉择?

李京梅:过去一年发生很多事情,不光是澜舟科技本身,今天大家都说大模型特别卷,这个圈特别卷,这是全方位的。

从开始ChatGPT出来大家觉得非常惊艳,我们主要面向B端的客户,但B端的客户也都是由普通的人组成,无论是C端、B端,大家认为大模型做的事情是无所不能的,期待值特别高。去年下半年开始趋于理性,大家开始冷静思考大模型到底可以给企业和人带来怎样的价值,有怎样的收益。

在这些思考的过程中,我们作为一个大模型的创业公司也要选择自己赛道。

这一年下来,我觉得比较庆幸的是坚持了自己的赛道,就是坚持垂直领域专业赛道。我们今年更多专注在应用落地,雷军之前有互联网落地的七字决“专注、极致、口碑、快”。当澜舟科技在服务客户进行大模型落地时,创始人周明提出了九字决,即在七字诀上加上“成本”。

去年大家更多关注大模型本身的能力,今年则会更加关注场景驱动,所谓的场景驱动就是坚信,大模型面向企业落地的时候不是把AGI全部用上,用三个能力就够了:阅读理解、通用写作、多轮对话。

去年我们发布了若干不同尺寸的大模型,包括7B、13B、40B的大模型,消耗不少算力。调研发现,我们接触到的80%的企业客户用不上这么大的模型,它所要的场景用不到这么大的模型。企业要考虑成本和性价比,它想做的场景其实用13B相对比较轻量的大模型就够了。

今年策略上的调整,就是我们会坚持轻量化的大模型,创立之初是孟子轻量化的预训练模型,今天是轻量化的孟子大语言模型,我们也坚持了落地的路径。但的确在策略上有一些调整,面向企业的应用,今天的场景也比较明确了,我们面向企业落地的应用有三件套,澜舟智库是面向企业的智能知识库平台,澜舟智会是专注内容分析的智能会议助手,还有一个澜舟智搭,我们定义为智能Agent应用搭建工具平台,很多企业希望自己有一定的个性化搭建应用的能力,所以这是一个简单的工具平台。我们基于孟子大模型主打应用的三件套,面向企业落地,更加聚焦产品化应用场景驱动,我们的大模型也会面向主打的场景定向做优化,不搞大而全,我们坚持小而美。

暗涌:昆仑万维呢?

方汉:我们思考的比较多,去年做的战略规划也比较成熟,过去一年的思路没有太大的变化。

首先,我们非常明确,因为我们公司是一家做C端的公司,我们的基因就是C端。我们一直秉承着给C端提供服务的思路,国内市场面向效率和工具,就是天工AI。去年8月发布了国内第一款AI搜索产品,我们还是从用户的角度倒推大家的需求,发现用户对大模型有很多工程上的需求。

为了工程上快速满足用户需求,我们提供了PPT生成,研究模式,增强模式等功能,把这些功能做完了以后,你会发现用户的满意度和长期留存自然上来,对我们的用户增长带来很大的帮助。我们的用户数目前在国内排前三名的位置。

海外市场还是做偏向娱乐的AI UGC平台。我们观察到一个现象,让非母语的人做文化产品几乎不可能成功,而中国人在全球可以做成的都是工具和平台型的企业。抖音是内容平台,我们在海外利用AIGC做内容平台,得出的结论是产品的形态仍然是需要创新的。

如果产品形态不创新,很难拿到用户红利。我们目前在海外的AI音乐和AI社交产品起量比较快,因为产品形态是用户没有见过的。这个时候可以得到比较大的红利。如果你技术上没有创新,那用户凭什么用你。我们今年发布了国内首款AI音乐生成大模型--天工Skymusic,全世界可以跟我们相提并论的只有Suno。我们技术上取得进步以后,在产品上可以拿到一些红利,这是我们目前的历程。

没有什么艰难的抉择。去年热度特别高,人才获取上有一定难度,今年人才获取上会变容易些。

第一波融资的企业钱烧的差不多了,而且由于这个方向太热,大学的嗅觉很灵敏,几乎所有CS专业的博士和硕士都在往这个方向转,人才供给的情况得到极大的缓解,这是好事。

我们所有做AI的创业者,大家对短期有点过于乐观,对长期又有点过于悲观。恰恰应该反过来,我们对长期应该偏乐观的,但对短期来说并不能过于乐观,可能悲观一点反而可以让你走得更远。

应用大爆发的时间点

暗涌:很多人说推理成本再降一个数量级可能会迎来国民级的应用,你们怎么看所谓的应用大爆发的时间点,以及在哪一些方向和场景可能是最先会看到这种可能性的?

方汉:推理成本和摩尔定律一样,几乎是每十个月,一开始可能是十倍,以后可能是每十个月一倍的速度下降,这是没有疑问的。因为技术的推动就是这样,我们推理成本会迅速下降。但推断成本降到零又怎样,我们在海外做C端的成本,推理产品只占每天运营成本不到10%,推理成本对我们来说并不是核心的问题。

核心问题是你的用户获取成本,其实远远高于你的推理成本,推理成本有大量的工程上的优化空间。推理成本的下降对我们C端产品能否在全球工程发力不是决定性的因素,决定性的因素是产品形式的创新,以及产品整个用户体验上的提升。对最终用户来说,他根本不关心成本,只关心这个东西新不新,好不好。

我觉得对C端的竞争态势来说,没有太大的影响,这是个人的感知。GPT-4一免费,用户增长据说涨了40%,大家知道OpenAI的用户很久没有增长,这对用户的增长没有本质影响。

AI应用爆发的时间点跟推理成本下降没有关系,但跟端侧推理有关系。

大家的手机什么时候实现端侧推理,这是非常大的里程碑。我去年说端侧推理是中小创业者特别大的机会。苹果在iOS18里接了Open AI和小模型,这个影响非常大。我觉得今年下半年的iPhone16会是比较里程碑的事情,因为第一次让全世界所有人都知道大模型这件事,人工智能这件事开始跟我们息息相关。

第一批的尝鲜者使用iPhone16这样的产品。换机潮时间是3年,三年以后可以人手一部AI手机,在AI手机出现以后,对大量的中小创业者会有非常大的机会,因为手机上的端侧的小模型可以做很多事情。下面比的就是产品形式的创新,真正的大浪潮还是以端侧推理和AI手机的普及为代表。

有一个巨大的问题,因为所有重要的入口还是把控在操作系统厂商上,安卓、iOS和中国的银河联盟,中小创业者拿不到底层系统入口,这是比较大的问题。我相信这个问题也是有一天可以打破的,这是目前的观察。

暗涌:端侧大模型的运行,除了刚才提到的,是否还有其他限制?

方汉:主要受限于大家换手机的速度,旗舰手机都可以推3B-7B的模型,下一代的手机可以推到13B、30B都有可能。但问题在于老百姓根本不关心手机可以推多少,只是每三年手机实在太卡了换一台,我们观察到的换机周期是三年。三年以后才能人手一部AI手机,在此之前,你的产品应该开始获得口碑,不能等到人手一部AI手机才做这件事。对创业者来说,现在是最好的机会。

暗涌:现在端侧的大模型其实很多功能还是要在云上实现吧?

方汉:端侧指的是完全在手机侧,不需要买端侧任何东西。现在苹果做了一个模式,手机侧预装3B模型,很多事情3B模型做。3B模型干不了,再去苹果的私有云上相对大点的模型来干。如果这个再干不了,再调取GPT-4o。如果用户关注隐私,更相信端侧的模型,数据不需要去云。就算去云,也希望利用联邦学习的方法让数据得到更加安全的保护,最终肯定是混合模式,但主要的推理在手机的小模型上进行。

暗涌:从B端视角怎么看推理成本降低的影响?

李京梅:分两方面,我出来创业之前在阿里云工作,再之前是在微软,也包括中国本地。很多企业按照token、 API收费,对创业公司影响不大,更多是云厂商的策略。

对云厂商来说,它的规模化只要能够提升,单价成本肯定会降低的,这是从云厂商的算力提供方来说。

从使用方来说,其实对很多基于大平台做自己AI应用的,不管是创业者还是其他的企业都是有好处的。虽然看起来好像千token、百万token很便宜,但作为对话和应用调用的时候,这个token非常具像化的,是以字/词为单位的。通常你读一篇文章一页word可能上千字,折算下来的量,对应用开发者来说也是一笔可观的费用。

我们主要面向B端,简单的降价对B端的企业或者说对我们面向ToB的大模型创业公司来说没有特别大的影响。因为企业客户重视的是效果第一。方汉讲了C端关注形态,B端的客户关注效果,效果对他们来说就是性价比。

从另外一个角度来看,推理成本下降从长远来看一定有意义。澜舟科技面向B端客户主打孟子13B大模型,其实也是基于目前市场企业持有的GPU现状,希望帮助B端的客户整体降成本,尤其是国内企业客户基于数据安全和隐私

考虑,更偏向于做本地化部署。当推理用起来进一步降低到消费级到CPU端侧,对在企业里大面积普及基于大模型的应用肯定是利好的,但重要的还是能看到立竿见影的效果。

AI生态中的最大赢家

暗涌:你们觉得AI ToC和ToB的生态里最大的赢家是谁?在新的流量入口的争夺中,大厂和昆仑万维这种中厂以及澜舟科技这样的创业公司,各自的机会是什么?

李京梅:没有特别确定的答案。今天为什么说特别卷,以及大家都在做很多尝试,还是没有看到终局,哪怕比较确定的趋势。

从大模型创业公司来说,已经有两个主要的赛道,往AGI方向发展的Minimax等等,这是走大而全的路线,通用人工智能。澜舟科技从去年到今年还是走小而美,更多的是看落地。今天没有一个大模型在企业的任何场景都可以表现最优,所以我们还是得把主控权放在自己的手里。

往下走的话,我们选择的赛道还是落地为王,会有时间窗,我们会跟客户在一起。企业也会有超级应用,大模型和数据在一起,大模型自然会跟客户在一起。对B端大模型落地而言,现在说赢家是谁时间还早,我估计年底会看到一些趋势。对ToB来说需要时间,C端更是需要时间。方汉讲了对C端来说需要一些惊艳的产品形态,今天的大模型产品形态,还没有特别能够出挑的,需要让子弹再飞会。

方汉:OpenAI把GPT-4o给苹果用是免费的。可以很明显地看出,目前所谓的超级应用在操作系统厂商垄断语音和视频入口的情况下,是非常苍白和无力,处于弱势的地位。

谷歌每年付几十亿美金给苹果去买搜索引擎,将来的大模型地位不会比谷歌搜索引擎更高。

第一个赢家已经出现,就是手机操作系统厂商,它垄断了声音、视频的入口,所有超级App都无法避过。但有什么样的赛道是不用向操作系统厂商低头,还是内容平台。苹果上的YouTube、TikTok不需要向苹果低头的,因为用户创造的内容都在这个上面,用户不会因为是苹果还是安卓就换自己的平台。我们也非常相信在AIUGC平台上一定会有新的竞争者出现。

是不是超级App不重要,对用户来说,这个平台有没有新的高质量内容才是更重要的。AIUGC最大的好处是降低了所有人创作内容的成本,导致内容创作者的规模将在全球有十倍以上的增长。

同时,在一些不发达的地区和小语种里面,本来缺乏内容创作者,这些内容创作者也会大幅的出现。对我们所有在做海外市场的人来说是非常好的机会。

暗涌:互联网、移动互联网,包括AI四小龙时代,可能给现在的大模型时代带来哪些启发?很多人说不会出现移动互联网时代那种万众创业的局面,你们怎么看?

李京梅:之前的AI四小龙主要还是做视觉,感知智能。今天更多讲大语言模型,包括多模态也是文生图和文生视频,这是技术的演进,这跟四小龙在技术时代是不一样的。

今天比较大的挑战,比互联网创业多了两个字,就是成本。对于企业来说需要做到性价比最优。另外来说就是整个中国的市场模式很难收敛成标准的产品形式,更多时候会基于客户的个性化需求去落地,产品形态比较发散,无论是企业,也包括政府和金融机构。

今天大语言模型同样有类似的问题,有成本的问题,但还有一个大生态的问题。最近有很多讲中国B端软件市场的观点,我们这种从技术基因出发做创业的,很多时候还是会偏工具平台。

工具平台给企业能够带来的价值会是降本增效,直接能够帮助企业客户创收,相对会比较间接。

澜舟科技已经三周年并即将开始第四年,前面两年偏向于多维度探索市场、技术、客户、资本、媒体等,我们今年相对聚焦做企业应用产品。我们期望可以把相对能够标准化的工具型产品做出来,比如刚才讲的澜舟智搭,能够让企业自助做一些东西,希望在这个方向上探索出对大模型的创业公司跟企业都能够接受的产品形态,从而降低大模型在企业落地的成本。

方汉:上一波AI四小龙时代对我们普通人的影响是在支付的时候刷脸,但对我们的生活没有什么影响。这一波的大模型和AIGC会发现对我们普通人的影响非常大,小学生利用大模型写作文和画图,我们每天看到的短视频很多利用AI生成。我们看到淘宝商品图都是AI生成的为主,这对普通人的生活影响是全方位的。

C端的机会也是空前的,因为不得不承认这一波的AI极大地降低内容创作成本。比如说天工音乐大模型,我五音不全,但我用天工音乐做了上百首歌,在微信群里到处分享。我这辈子没有创作音乐的机会,但现在有了我们这种AIGC的技术加持,可以轻松地创作音乐,马上又要轻松地创作视频,以及成熟地写文章,整个内容赛道迎来黄金时代,会有更多新的内容平台出现,也会有更多新的内容形式出现。

这对普通人最大的影响是可以消费的内容规模至少是以百倍的速度在成长,这可能是非常大的趋势。创业者在C端的机会非常大,但C端讲究规模效应,规模上不去,那可能很难有长久的发展。中小企业做B端更容易赚钱,做C端有可能赌一个特别大的,但成功机率比B端低很多。