大模型的两条落地方向,虽南辕北辙但境遇相似。
被寄予商业化落地厚望的是确定性较强的to B方向,只是目前看来还还击不穿成本的隔膜,定制化叙事背后的高人力、高资金成本阻碍业务向下普及,增量缓慢。而此前尚属于测试阶段的to C方向自不必说,无论是产品形态的成熟度还是用户心智深度都还不足以支撑商业化,这也是业内将聚光灯自最初的C端向B端转移的原因。
这一格局在近日发生了变化。8月31日,首批通过《生成式人工智能服务管理暂行办法》备案的11家大模型正式上线并可面向公众提供服务,并且对使用境外AIGC能力做出了限制。
这对通过备案的厂商而言,意味着C端场景的合规落地,而且依靠API能力的中小AI服务商这一类“搅局者”也正在被“肃清”,据了解,有第三方服务商因使用ChatGPT能力而收到了相关部门的约谈通知。换言之,C端市场的竞争格局正逐渐明朗起来。
即使大模型的C端场景应用目前尚未看到商业化的可能性,但是互联网毕竟是流量生意,大模型同样具备如今美团、微信、支付宝等重度应用的“流量入口”能力,甚至更进一步,成为安卓亦或是IOS。这也是我们在大模型风起之初,便做出的判断。
顺理成章,以百度、科大讯飞为首的厂商们均开始了互联网意味浓厚的“冲量”动作。以8月31日凌晨“先声夺人”的百度为例,我们观察到诸如多次在直播间教用户写prompt、参与全国科普日这样的线下活动以及申请软件著作权等动作,不难看出百度试图在消费级市场建立心智的目的。
从内测到开放、自幕后走向台前的大模型服务商们共同进入了一个比较尴尬的位置——明知商业场景有限,却又不得不向C端投入资源。即使是一众大厂中最晚发布大模型的腾讯也公开表示未来将向C端提供服务。
一时间,大家都是箭在弦上,不得不发。
大模型掘金,用户比企业更快
自6月ChatGPT出现热度下滑起,我们便越来越感觉C端大模型的“食之无味,弃之可惜”。毕竟这是连行业头部都解决不了的商业化困境,后来者选择绕开也是理所当然。
但热度下滑并不意味着缺乏场景,只能代表网络中讨论的声量与关键词的出现频率降低,而不能直接反映C端用户们的使用情况。我们了解到,大模型在C端的应用其实正在不断深化,而且个性化程度也愈发加深。
“一篇文章80元,使用大模型操作的话,这样的文章我一晚上可以轻松写出3~5篇。”目前供职于一家跨境电商企业的小刘说。
自三个月前,小刘申请获得文心一言与讯飞星火两家大模型的测试资格后,他便开始在兼职广告公司软文写作时大量使用大模型能力。他的使用感受是,在甲方给出较为明确的需求的情况下,可以轻松用大模型生成某一需求文章的“初稿”,自己只需要花费十来分钟时间调整润色即可。
如今他的讯飞星火界面存在着9个对话,分别是一个自己的“私人频道”以及8个不同公司的“主题频道”。每当他接到兼职写作需求,他只需要在对应频道中提出自己理解转化后的新需求,大模型会根据既往“投喂”的数据以及最新需求为他生成文章。而私人频道则是他自己的生活助手,目前使用频率并不高。
大模型给他带来的直观改变,是曾经需要在短暂的下班休息时间中抽出两小时左右时间的兼职任务,如今只需要大约半小时即可。
这只是大模型在C端场景应用的一个缩影。实际上,大模型的AIGC能力已经开始冲击更为广泛的传统人力写作市场。我们了解到,ChatGPT的出现已经成功把论文代写的价格“打下来”。一篇万字论文的写作,如果同意使用AI,那么其价格仅需要100~200元。
虽然代写早已不似多年前一般“风光”,但仍以“灰产”的身份持续存在。一位AI代写商家透露,通常人力写作一篇万字论文需要数天时间,而大模型介入后,初始文本的生成仅需半小时左右,接下来需要经历机器与人工多层润色,总体需要耗时半日。
“只有少数学术性比较强的毕业论文一类,我们会多次润色。如果只是海外大学的Essay作业一类,或者是国内理工专业的编程作业一类会更快,审核校对的工作留给客户就好”,该商家透露。
只是AIGC的产业化毕竟不如个人使用一般随意,学术语境的严肃程度也不是充斥互联网之上的PR文章能够碰瓷的。据了解,该商家如今主要使用的还是性能上更为先进的ChatGPT,商家还针对不同高频需求的学科建立了对应语料库,主要以此前代写的论文为主。
从上述案例不难看出,与“能者优先,竞争上岗”行业大模型不同,C端大模型不需要模型对业务的深刻理解也能发挥价值,而且深度也同样存在。即使在商业化尚不明朗的情况下,我们仍不能将C端一棒子打死。相反,如果能找到一个商业化的支点,C端大模型的商业化进程或许能跑得比B端更快。
向杀手级应用进化
几个月的重度使用,让小刘切身感受到了国内大模型的迭代。他主要使用的讯飞星火与文心一言,同样是在国内大模型的C端赛道中,最具代表性的两家。
最为明显的变化,在于大模型已经从最初一个简单的文字对话窗口演变为支持图、文多模态交互窗口,而且文心一言、讯飞星火等面向用户的大模型都在陆续上线不同的场景prompt,帮助用户降低使用门槛。
小刘称,他刚开始使用讯飞星火时,不仅多轮对话与交互能力较差,大约5~8次对话后,大模型便会“忘记”之前的对话,甚至还经常碰上一次回答难以生成全文的“断裂”现象,其原因或许在于讯飞星火对生成tokens数的限制。
然而现在,小刘反映称,讯飞星火已经可以轻松生成千字规模的文章,虽然偶尔免不了一些AI痕迹严重的口水话,但是在2~3轮对话中基本可以解决。
不甚愉快的使用体验一度让小刘转而投入文心一言的怀抱,但随着场景prompt的出现,小刘开始在两家之间摇摆。我们可以看到,即使讯飞星火入场相较文心一言更短,但模型能力以及消费级的基础应用却可以很快追上。单就模型而言,已经露出同质化竞争的迹象。
况且我们放眼全球市场的话,还存在如OpenAI、Claude等闭源寡头,单纯以模型为商业化支点将面临巨大的竞争压力。事实上,深入产业的商业化叙事与开源拥抱市场的低门槛叙事便是在这样竞争压力之下所诞生。
进一步说,C端大模型的竞争不在于模型本身,而需要另一个支点。目前看来,这一支点大概率会是杀手级应用。
“卷大模型没有意义,卷应用机会更大”,正如百度CEO李彦宏所说,C端大模型的竞争已经进入应用层,一款杀手级应用的出现将具备率先收割大部分用户并成为“超级入口”的潜力。就像曾诞生了《愤怒的小鸟》、《水果忍者》等应用的IOS。
如果我们参考IOS生态的发展路径,首个爆款《愤怒的小鸟》的出现相比App Store的出现晚了一年左右时间,这或许是我们期待的首个爆款出现所需的时间。这款应用可能出现在任何一款面向公众的大模型中,除了内部开发外,发力应用层的玩家们迫切需要的是为第三方开发者们提供完整工具链与生态环境。
从百度近期的动作来看,我们不难发现因循这一逻辑的布局。
近日,百度在其年度的云智大会上为5月31日开启的“文心杯”创业大赛颁奖,并推出百度智能云千帆大模型平台2.0,其中隐藏着的暗线便是百度依据第三方开发者的反馈,就模型开发的工具链,自3月27日发布的千帆大模型平台1.0版本迭代。
内部开发方面,百度也将自己作为立身之本的搜索优先重构,文心一言界面的百度搜索插件默认开启,而代表AI能力的“对话”入口也百度网页端的子栏目中位于最靠前的位置——两者互为入口,走上了“结合”这个最基本的重构之路。
只是在使用体验上,AI搜索还存在数据时效、幻觉等固有问题,导致AI搜索的用户体验甚至不如纯粹的搜索。即使考虑到这大多是大模型目前的共同问题,其“重构”的逻辑也与百度喊出的“AI原生”并不相关。
参照移动互联网的迭代经验,传统互联网中存在淘宝、QQ等应用只需要简单无线化便可以搭上移动互联网快车的先例,在确保不掉队的前提下谋求更大的业务可能。只是更大的机会在于原生应用,无论是基于手机定位能力的网约车还是基于手机即时通信能力的微信。
相比既往业务的重构,原生应用成为爆款的可能性会更大。
定制助手,人的延伸
媒介是人的延伸,是人的感觉能力的延伸或扩展。传播技术学派的麦克卢汉在上世纪对媒介技术的论断至今仍为大模型所验证,例如ChatGPT爆火而引发的“取代人类”叙事在短短半年内被打破,即使大模型再“无所不能”,也只能为人所用。
同样的逻辑自然也可以延续到AI原生应用的开发上。一位大模型从业者表示,大模型的智能涌现与泛化能力让其成为了人类脑力的延伸,即使目前大模型只能做一些简单重复的劳动,仍然可以将人从一些繁复场景中解脱出来,去做更具创造力的工作。
“面向C端的应用高度需求产品设计,不同生活工作领域的助手是一个很不错的设计方向”,该从业者说。
“助手”这一业务方向一直都是AI圈的热门话题。国内有阿里在钉钉推出数字员工,在淘宝内测用户决策助手“淘宝问问”。海外有微软不断迭代旗下的办公助手Copilot。
无论是to B还是to C,个性化的智能助手都能找到发力场景,只待大模型玩家们入局。对模型底座有底气的服务商,还可以开放助手机器人开发服务,支持个人或企业组织在平台上开发专属机器人作为智能助手并收取费用。
我们观察到,已经有部分社区与开发者借助开源模型能力打造智能助手平台,以此推进商业变现。而还在培养用户心智的国内大模型虽然同样上线了智能助手开发功能,但目前还处于免费测试阶段。
如果放下模型底座能力不谈,国内一众大模型玩家的商业化步伐略显缓慢,很可能只是在过去半年内都无法正式面向公众提供服务。况且我们也自许多从业者处了解到,许多开源模型的底座能力其实并不强,大多都还处于追赶GPT3.5的阶段。
如今,玩家们终于等来C端这个大模型练兵场,无论是像百度搜索、淘宝问问这样的既往业务的重构,还是具备更多可能的AI原生,都存在一展拳脚的机会。
刚刚彻底开放的大模型赛道迎来了智能助手这一赛点,其成熟与爆发很可能是新一轮的行业洗牌潮。