在《跨越鸿沟》这本被誉为“科技企业营销圣经”的书中,杰弗里·摩尔这样写道:“高科技产品面世过程中,最危险、最关键的一点,就是由少数有远见者所主宰的早期市场,向实用主义者占支配地位的主流市场过渡。”
在当下国内众多的行业之中,生成式人工智能(AIGC)作为半年内迅速发展、正在检验商业化落地的行业,正面临着这个关键的过渡阶段。
而在该阶段里,互联网企业、AI企业、小型创投企业纷纷投身于这场波澜壮阔的生成式人工智能市场的竞争大潮中,它们依靠各自拥有的用户资源、生态优势与奇思妙想,为众多的用户提供更加个性化、智能化和便利化的产品和服务。
但是,大模型作为动辄投入数十亿的项目,故事势必要从巨头们讲起,而作为这场大模型竞争中的主要玩家之一,率先发布文心一言的百度不可谓不是其中的领头羊。基于过去数年在AI赛道中探索的实力与企业应用大模型的渠道,从通用大模型、行业大模型与应用生态构建等数个方面入手,而具体的打法从相关人士的发言中便可见一斑。
百度智能云事业群总裁沈抖表示,企业应用大模型主要有三种方式。第一种是构建基础大模型,只有少数企业会自建大模型,因为训练大模型的成本和技术壁垒都非常高。
第二种是建立行业大模型,通常是了解行业的企业,结合自身掌握的行业数据,用基础大模型精调出更贴合实际场景的行业大模型。“从零建设行业大模型是伪命题,能建设一个好的行业大模型的基础是有一个强大的基础大模型,在此之上再进行迭代。”
第三种是在基础大模型和行业大模型之上,开发AI应用。这类企业其实是大多数,他们要思考的是:如何在这个大模型之上做好提示词工程,解决特定应用场景的问题。如何从模型效果、迭代速度、工具链这三大方面去选择一个好的大模型。
而百度也确实是在大模型底座、行业大模型与AI原生应用三条赛道上一齐发力,那么,百度文心大模型在这三大层面中做了哪些努力,推出了哪些平台与打法,又有哪些“意难平”?在技术落地生产力的过程中,最重要一环之一的商业化又有哪些潜在问题呢?
1
先发证明模型底座实力
但优势难转为胜势
作为“大数据+大算力+强算法”结合的产物,大模型应用效果的基础是高质量的训练数据,这对业务领域训练数据的准备,尤其是认知场景训练数据的准备提出了更高的要求。高质量的训练数据加之高昂的算力成本,使得通用大模型天然成为了大公司之间的游戏。
在训练数据规模上,据IT之家报道,于10月17日最新发布的文心大模型4.0参数规模为目前所有公开发布参数最大的大语言模型,预计可能突破万亿级别。
如此大参数量的模型,对算力的要求自然也更进一步,据媒体报道,文心4.0是在万卡AI集群上训练出来的,应该也为国内首次使用万卡规模集群进行训练的大语言模型。而万卡集群,国内目前只有华为、阿里透露已建成万卡AI集群,但我们都没看到基于它推出的具体模型。
在海量的训练数据与充足的万卡并行算力外,在从文心大模型1.0诞生迭代至今的近5年间,百度在IT技术的技术栈发生根本性变化的过程中,也从过去“芯片—操作系统—应用”三层架构,重建成为了“芯片-框架-模型-应用”四层架构,在每一层之间的严格要求下,完成端到端的额优化,为深度学习与大模型的发展打下了坚实的基础,成为大模型能力落地产业化最基础的智能底座。
截止目前,百度是全球为数不多、在这四层进行全栈布局的人工智能公司,无论是高端芯片昆仑芯,是飞桨深度学习框架,还是文心预训练大模型,各个层面都有领先业界的自研技术。而芯片、框架、大模型和终端应用场景也形成了高效的反馈闭环,帮助大模型不断调优迭代,进而升级用户体验。
而在今年百度2023世界大会中,李彦宏表示文心大模型4.0,实现了基础模型的全面升级,在理解、生成、逻辑和记忆能力上都有着明显提升,他还称综合水平“与GPT-4相比毫不逊色”。
可以说,从通用大模型底座的实力来看,文心大模型在国内的众多竞争者之中绝对名列前茅,但如此强大的能力,也并不意味着能“躺着”赚钱,反而更像是百度的“背水一战”。
从研发投入的角度来说,无论是突破万亿级别的训练数据,还是使用万卡集群训练的成本,所需要占用的软硬件资源是可想而知的。有业界专家推测,百度在训练文心大模型4.0时所付出的推理成本,大约会比3.5版本高出10倍左右。
据统计,自2022年底,过去十年之中,百度已经累计投入了超1400亿元的研发资金,而在今年的大模型更新迭代中更是呈现出疯狂“烧钱”的趋势,经年累月且快速增加的投入,让百度已经到了无法“收手”的阶段,不论商业化效果是否成功,只要有一丝前景,便必须在大模型之路上狂飙下去。
从竞争对手的角度来看,随着大模型技术的发展,越来越多的企业和研究机构开始涉足这一领域,在通用大模型领域中虽然竞争对手较少,但个顶个都是顶尖的互联网企业。无论是阿里的通义千问,腾讯的混元,还是华为的盘古,都有着与百度文心一争的实力。同时,这些大厂的通用大模型依托企业自身本就拥有的业务场景,将形成很大的竞争压力。
对于大模型的收益问题,百度方面的看法是,短期内就看到大模型盈利是不现实的。因为这么大,这么长周期的成本投入,是无法在单点上计算盈亏的。就大模型本身而言,因为未来的前景足够大,确定性足够高,现在最关键的还是保证效果可用,做到明显优异于其他厂商的性能和表现。这个是百度的当务之急,也是已经见到成果了的。
而从长期来看,盈利的方式会很多,不只是做技术供应商。还有通过赋能业务本身来赚钱。事实上过去的10年AI投资,也不是不赚钱的。比如百度的搜索,一直都是AI赋能最重要的应用。以搜索撬动的商业模式一直也都是赚钱盈利的。如果没有AI的坚持投入,可能搜索早不是现在的样子,百度也就不会有千亿级的营收了。
总的来说,从技术实力上来看,百度文心的通用大模型是最无需赘述的一层,但在能否商业化落地、商业化落地前景如何、能否形成生态闭环、何时形成生态闭环的诸多诘问与竞争者的虎视眈眈之间,也让文心通用大模型面临着巨大的挑战。
2
行业模型显实力,
落地效果还得看应用?
如果说通用大模型是能够处理多种任务的“百科全书”,有着泛而不精特点,不能直接应用于生产生活的话,那么行业大模型便是针对特定领域或任务进行优化设计的“操作指南”,其受众或许很少,但专业度一定很高。
就在9月中下旬,百度也发布了国内首个“产业级”医疗大模型——灵医大模型,目前已与固生堂、零假设等达成合作,并已定向向公立医院、药械企业、互联网医院平台、连锁药房等200多家医疗机构开放体验,为患者、医院、企业等提供AI原生应用。
在此前,百度早已在通用大模型的基础上,根据客户实际需求提供差异化的模型服务,据公开资料显示,百度文心行业大模型的数量已经达到11个,覆盖能源电力、金融、航天、传媒、影视、汽车、城市管理、燃气、保险、电子制造和社科多个领域。
而百度发力推进行业大模型的打法,其实也并不难以理解。
对于小型企业来说,相关AI应用便足以支撑相关业务;对于超大型企业来说,从底座开始构建基础大模型,则是最好的选择,而对于那些AI应用不够用,基础大模型“用不完”的特定行业企业,用基础大模型精调出更贴合实际场景的行业大模型则是首选,而这类企业也是数量最多,商业化前景最好的客户群。
但是,企业数量多、商业化前景好的另外一面,便是难以匹配不同行业中复杂的生产场景,在不同行业企业生产场景不同与不同体量企业需求不同的共同交织下,大模型的落地显得愈发困难。
面对如此情景,百度选择了将能力开放给企业端,让客户既可以自由调用各类第三方模型服务,又能够基于自有数据、特色开发、部署和调用专属服务,而千帆大模型平台便应运而生。
目前,千帆大模型平台预置了103款prompt模板,包含对话、编程、电商、医疗、游戏、翻译、演讲等十余个场景。其中既有基于百度智能云在产业实践中积累的prompt模板,也有来源于文心一言高频用户的prompt模板。
同时,在自有模型之外,千帆平台也为其他大模型打开了大门,提供33个严格优选、进行性能与安全双重增强后的第三方大模型,共同完成服务,企业充分享受“模型自由”。
丰富的产品能力、更加自由的大模型工具部署、多样化的服务方式,共同让千帆平台拥有了极强的场景落地能力,完美充当起了沟通基础大模型与企业之间的桥梁,吸引越来越多的企业打造出更多、更好的大模型产品。
不过,千帆平台再多的性感,也终究只是在技术与业务层面上的领先,行业大模型的竞争却仍然激烈。
由于数据量需求较少、技术门槛相对较低,诸多大厂纷纷下场“内卷”,无论是大型企业如华为、腾讯、阿里、字节,都纷纷将目光聚焦在行业大模型上。
此前,腾讯云在今年 WAIC2023上展示了金融、文旅、政务、传媒、教育等10个行业的落地案例。华为在7月发布盘古大模型3.0,并喊出“华为的盘古大模型,不会写诗,只会做事。”的口号,将落地行业的决心和对部分企业的嘲讽效果双双拉满。
而在互联网与科技大厂外,众多有着落地数据的初创企业也在这轮竞争中有着特殊的优势。
初创企业通常拥有高质量的数据,这些数据可以帮助初创企业在行业大模型的竞争中占据优势。同时,较强的创新能力往往意味着更加独特的行业大模型服务。此外,这些企业通常专注于某一特定领域,也是它们与生俱来的核心竞争力。
而在竞争对手众多、实力强劲之外,行业大模型作为重数据与行业经验,轻技术门槛的一层,更需要汇聚各个行业的优质数据集,而这也绝不是其中某一家企业能够做到的,只有依托生态的力量方可完成,而百度构建生态的方法,则是在应用层面构建开发者们的“花园”。
3
应用层生态圈正在成长
百度能否突破重围?
应用层面中,在通用大模型与行业大模型硬实力的支撑之下,海内外应用都在进行着如火如荼的尝试,微软、Salesforce、Adobe、SAP、Palantir等公司纷纷发布相关产品,完成场景应用落地。
作为Windows操作系统和Office系列软件的所有者,微软开放了Azure OpenAI赋能旗下产品,通过大模型技术最大化企业与员工的价值。
根据微软的财报会议,从2023财年的Q2到Q4,Azure OpenAI的用户数从超过200变为1.1万,环比增长十分迅速;而Microsoft365Copilot的发布,作为高效智能的AI办公助手,也在很大程度上解放了白领们的双手。
Salesforce则是从Einstein GPT走向AI Cloud,全面拥抱生成式AI。
Einstein GPT将公共和私有AI模型与CRM数据相结合,能适应实时变化的客户信息和公司流程,可在销售、服务、营销、商业等各个领域提供人工智能自动创建的内容。而AI Cloud作为其延续,支持代码生成和业务流程自动化等功能,客户可以将个性化训练的模型引入平台,同时将数据存储在自己的基础设施上。
在海外企业级应用加速落地的同时,国内的大模型企业也并不落后。
腾讯发布混元大模型后,快速接入腾讯云、腾讯广告、腾讯游戏、腾讯金融科技、腾讯会议、腾讯文档等50多个腾讯业务。
而AI企业中的龙头科大讯飞也结合自身的业务场景,推动大模型在办公、政务、电力、教育、医疗、工业、司法、金融等行业的场景落地。
而百度作为AI时代中最坚定的拥护者,也表明了自身的态度。百度集团董事长兼CEO李彦宏早在5月就曾明确表示,百度要把全部产品用大模型重做一遍。百度不是整合,不是接入,是重做,重构。
在百度已有的业务场景中,基于最新亮相文心大模型4.0,百度搜索、文库、网盘、地图等十余个应用在进行AI原生化重构后重新上线。新的百度搜索提高了对内容的理解,可以寻找多模态答案;新的百度文库完成了从“内容工具”到“生产力工具”的进化;商业应用方面,百度GBI也为企业客户建立“对话即洞察”的数据分析新范式。
但在其他企业一样改造自身业务场景外,百度迈出最大的一步,便是希冀于建设一个属于百度与众多开发者的生态花园。
百度世界2023上,百度智能云千帆AI原生应用开发工作台正式发布,该程序将大模型应用开发中常见的模式、工具、流程,沉淀成一个工作台,帮助用户轻松开发属于自己的AI原生应用。
目前,千帆平台上提供了检索增强生成(RAG)、智能体(Agent)等常用的AI原生应用框架。在每个框架下,百度智能云还提供丰富的样板间,支撑开发者敏捷、高效地进行AI原生应用开发。
而在应用开发平台之外,层级中更加细分的插件,也是百度重视的方向。
对于开发者来说,如果想要做一个AI原生应用,往往需要大模型能力基座、足够的高质量数据资产、高效率的场景调用分发与独特的创新性。但不幸的是,许多中小开发者只拥有他们独有的思维方式,在其他能力方面却显得十分“窘迫”。
而开发者们“捉襟见肘”的地方,却恰恰是百度优势的维度,于是灵境矩阵平台便应运而生。作为百度推出的文心插件开发平台,支持广大开发者根据自身行业领域、应用场景,选取不同类型的开发方式、模板组件等进行接入,旨在搭造更加场景化、行业化、定制化的AI应用插件。
其实从千帆与灵境的推出中,便能看出百度在应用层面中的决心,毕竟无论是投资千亿的基础大模型,还是发力推动的行业大模型,若是离开最贴近生产场景的应用的话,便是最大的泡沫,也更无法谈及商业化了。也正如李彦宏所说的"只有在大模型基础上产生足够多的AI原生应用,才是一个健康的生态环境。"
但是,百度的重视却并不意味着应用层面上的绝对成功。
相比其他大模型厂商,百度在大模型行业落地上的优势主要是体现在客户的交付保障以及全链路的服务能力。截至目前,有将近500个场景已经通过和客户共创取得了不错的效果。应该说第一阶段的试用和验证已经基本结束,进入到产业实际落地的第二阶段。
不过,从自有业务场景角度来看,百度的搜索场景相对于华为的工业场景,腾讯的娱乐场景,阿里的购物、支付、生活场景的确显得捉襟见肘,即使完成了AI的重构,能带来商业化盈利有几何还需时间考量。
而在自有业务场景外,开放出的应用与插件开发能力最终能吸引多少用户?在部分用户群体的身上能获取多少收益?也都是一个未知数。生成型AI应用的最大问题不是找不到用例、需求或分发,而是证明其价值。在当前的AI生态环境之下,应用层的更迭有多少价值尚且未知。
但是,作为一位投资者、观察者来说,其实也并不需要过分悲观,毕竟百度作为业内技术力顶尖的AI企业,同时也有着一套清晰的打法与思路,本就十分难得了。而具体的落地情况与商业化上限究竟在哪里,不妨给予百度更多一些的时间,再进行评价。
4
写在最后
作为十年前超越阿里与腾讯的中国互联网市值第一,当前甚至被众多“小辈”的估值所超越,这些年百度的日子不可谓好过,那么为什么技术侧最强的百度却在得不到对应的市值?这其实是一个很值得我们思考的问题。
除去没有快速进军云赛道、自动驾驶烧钱成果不大这些“战术”性的失误外,在移动互联网时代没有一款真正颠覆时代的好产品出现,才是百度最根本的问题。反观快速崛起的互联网新贵们,我们其实不难看出,在移动互联网时代,用户的体验与应用的落地才是最重要的。
站在AI时代之初,百度也喊出了All in AI的口号,希望通过聚焦重点行业进行单点突破,再通过技术的领先来带动其他业务线的思路是正确的。但正确的路上往往艰难险阻、荆棘重重。
参考资料:
1.《推理成本增加10倍?对文心大模型4.0的一些猜想》,夕小瑶科技说;
2.《重估百度丨大模型,能撑起百度的“今天”吗?》,自象限;
3.《百度智能云千帆,如何成为最懂企业的大模型平台?》,奇偶派;
4.《百度发布AI插件平台,大模型有了手和脚》,奇偶派;
5.《文心一言之后,百度的应用层之战》,财经杂志;
6.《大模型应用时代,百度开了个头》,晚点财经。