大语言模型发展至今,对各行各业的赋能程度越来越深,一些代表性产品正在改变甚至颠覆着整个行业。
简单回顾便能发现,ChatGPT 引领了一场文本创作革命、Stable Diffusion 等文生图大模型降低了绘画门槛、视频大模型 Sora 令影视从业者感到恐慌、音乐大模型 Suno 引发了一场音乐圈地震…… 我们能够感受到 AI 大模型重塑内容创作行业尤其是跨模态生成的巨大潜力。
如今,AI 大模型能力的释放,不仅可以将用户需求转化为成熟产品,也能让经典产品展现出前所未有的活力。
在5月30日举行的2024百度移动生态万象大会上,我们从百度搜索、百度文库、百度 APP 等产品基于文心大模型发布的各项行业领先新功能中,看到了全新的产品形态。
本届万象大会还是国内首个智能体生态大会,百度希望更多用户、创作者和生态伙伴加入并共同构建低门槛、多场景、高价值的智能体生态圈,探索智能体赋能产品、场景和行业的新思路。
百度集团资深副总裁、百度移动生态事业群组总经理何俊杰。
面向内容创作领域,已上线上百项多模态 AI 功能的百度文库,让智能创作时代正在到来。比如智能画本功能,用户只需要输入一句话主题,几分钟内就能自动生成图文并茂、人声朗读的视频画本。
这些全新内容创作体验早在2023年8月,百度文库宣布基于大模型全面重构为「一站式 AI 内容获取和创作平台」时便埋下了种子。自那时起,百度文库开始了蜕变之路。
正如百度集团资深副总裁、百度移动生态事业群组总经理何俊杰会上所言,「百度文库既是陪伴了用户已经15年的老朋友,也成为被大模型重构的新物种。」
现在,从内容获取、到创作编辑、到商业变现,百度文库作为一站式平台为不同群体、不同场景提供了针对性的 AI 功能和服务,在学习办公、家庭教育、兼职赚钱三大使用场景,为用户带来了更智能、便捷的创作途径与体验。
文心大模型全面重构
为百度文库带来「新生」
AI 大模型对产品的重构要有指向性,把握产品自身的定位和用户群体,了解主要使用场景和任务需求,才能做到有的放矢,实现产品新功能与用户方方面面的匹配。因此,百度文库的重构从一开始便要找准努力的方向,着眼于解决用户群体在当前内容获取和创作层面的主要需求。
在产品定位上,百度文库从以往单一的内容查阅平台,升级到了一站式 AI 内容获取和创作平台。对于学习和办公场景来说,这些功能带来的帮助尤为明显。
大会上,百度副总裁、文库事业部负责人王颖表示,「理想的 AI,应该端到端解决问题,让机器像人一样思考,让产品像人一样工作。这些,大模型重构后的百度文库都做到了。它将成为大家全天候的智能伙伴,让用户真正实现查阅无忧,创作自由。」
研报水平媲美咨询顾问
对于很多打工族、大学生来讲,百度文库已经从「内容工具」变成了「生产力工具」,智能 PPT 生成、文档生成、思维导图生成、研究报告生成、全场景指令编辑等 AI 功能,在专业文档和资料查询之外实现智能、高效、便捷创作。
我们以移动端智能 PPT 生成功能为例,它支持输入主题、上传文档和拍照生成 PPT。下面选择了输入主题来生成 PPT,对话界面可以手动和语音输入,从写大纲到自动生成一份内容翔实、配图丰富、逻辑缜密的完整 PPT,几十秒内便能完成。
此外,该功能支持 PPT 在线调整编辑、PPT 内生成专业图表、一键更换 PPT 设计风格、字体字号等,还能一键生成对应的演讲稿和思维导图。我们了解到,百度文库在行业内率先实现了多格式、多文档生成以及编辑全能力打通。
PPT 再转思维导图。
接着就是智能研究报告功能,这可能是文档类型中最难的任务了。
我们提出需求「帮我写一份2023年 AI 大模型发展的研究报告」,几分钟内便生成了一份12000多字的研究报告。对于需要改进的部分,直接调用 AI 编辑功能进行润色、扩写和续写即可。
在生成研究报告的基础上,同样可以继续自动生成对应 PPT。
一番体验下来,最大的感受是,在这些 AI 功能的加持下,百度文库已经成为学习办公神器,解决了用户跨平台、起笔难、编辑难一系列问题。并且,很多 AI 功能之间实现了打通,如 PPT 转思维导图、研究报告转 PPT,便捷性很强。
当然,百度文库非常注重生成内容的质量。就拿智能研究报告来说,它得到了专业顶级咨询机构罗兰贝格全球合伙人李冰的认可,「用了一下百度文库的AI研报功能,很超预期,生成报告的框架清晰、逻辑严谨,数据库支持权威,感觉已经像有一定经验的咨询顾问写出来的东西了。」
百度文库在学习办公场景带来了质的提升,无论是生成速度,还是多任务执行能力,极大提升了创作效率,节省了时间。
一句话、几分钟生成视频画本
除了持续赋能学习办公场景之外,百度文库近来开始全面发力跨模态内容创作,有了一系列动作。5月,百度文库行业首发智能画本功能,首创图文声并茂 AI 视频画本创作能力,对用户全面开放。
在家庭教育场景中,没有绘画功底的父母现在可以通过智能画本创作功能进行专属故事创作,还能将孩子脑海中天马行空、稀奇古怪的想法具象化描绘出来,一举多得。
用户只需输入一句话主题,剩下的一切交给 AI。我们以「端午节为什么要吃粽子」为主题来创作画本。百度文库会根据自身对该主题的理解生成一份画本大纲,然后选择画本风格,这里使用了卡通风。
接下来只需等待三到五分钟,就能完成画本创作。整个生成过程中,经过特殊的模型处理和训练,前后画风、对象关系都能保持一致。如果对生成的一些图片不满意,还可以重新生成。文字描述也支持重新编辑,对用户很友好。
最后播放「视频画本」,通过手动或自动翻页效果和童声朗读,更能吸引孩子。
加入智能画本功能之后,百度文库变得更有温度,为亲子之间提供趣味更强、更能投入其中的沟通与互动媒介,增进感情。这样一来,既能帮助父母低门槛地实现对孩子的常识教育,也能激发孩子的想象力,培养他们的阅读兴趣,寓教于乐。
此外,为了向用户提供更加丰富的画本创作体验,百度文库还与国内头部 IP 进行内容合作。比如,百度文库宣布与「猪猪侠」IP 达成战略合作,行业首创「3D 风格 AI 画本」创作功能,猪猪侠 IP 也正式入驻百度文库。后续用户可以选择猪猪侠形象进行智能画本自由创作,让经典动画 IP 形象通过智能画本功能传播更广。
小白也能画漫画、写小说赚钱
现如今,借助 AI 大模型的文本和跨模态生成能力,普通人也能产出不错的作品,并在不同的内容平台通过写文章或画画赚钱。
百度文库也在这方面下了功夫,通过智能漫画、智能小说等跨模态 AI 创作功能,帮助人们更容易地将创作内容商业变现,成为兼职赚钱的好帮手。
先来看智能漫画生成功能,它在行业内率先打通了 AI 漫画创作全链路,多场景和多人物处理、人物一致性、故事完整性都实现了行业领先。重要的是,漫画这一专业性很强的内容创作类型让小白也能触手可及了。
像智能画本一样,智能漫画的生成也很简单。下面以「周处除三害」为主题创作漫画,AI 会先自动创作出一篇与主题相关的完整故事,然后生成符合故事剧情的漫画分镜。
接下来选择漫画风格,并设定角色形象。
最后自动生成完整的漫画作品,整个过程同样在几分钟内搞定。
如果画面不符合预期,还可以局部调整和修改。通过重新编辑画面对应的文字描述,让 AI 精调出更符合需求的画面。
百度文库表示,生成的漫画作品基本可以做到「直接可用」。因此,这些作品可以投到第三方漫画平台赚钱。同时,百度文库还宣布与《秦时明月》背后制作团队「玄机科技」达成战略合作,在跨模态技术和内容上进行共创,为 AI 漫画创作者提供流量扶持等激励措施,拓展变现渠道。
除了画漫画赚钱之外,我们更经常听到的是「兼职写小说赚了多少钱」的报道。小说创作已经成为兼职行业的前三选择,但同样存在门槛,即便能写也不一定能写好,成为爆款并挣钱就更难了。
智能小说生成功能可以帮助创作和编辑长篇小说,提升小说内容的产出效率和质量,让小白用户也能轻松创作出剧情连贯、角色吸睛、扣人心弦的小说。
过程中,用户通过设置标签、随机标签、生成大纲,然后生成小说片段。完成之后还支持一键续写,进一步丰富小说内容。
生成小说的质量也得到了肯定。据介绍,有小说爱好者使用百度文库创作的小说,在发布到小说平台后很快收获上万点赞,并开始赚钱了。
百度文库也与喜马拉雅达成战略合作,联合推出「AI 短故事短剧写作课」,为喜马拉雅平台上千万创作者提供智能文档、智能小说、智能漫画等一系列 AI 创作服务,用户还可以通过百度文库、百度小说等平台进行分发和变现。
我们看到,百度文库正在向人们释放了这样一种信号:无论是文本、跨模态的内容创作还是想靠 AI 创作来赚钱,如今都能依靠一个个「可用、可信、可靠」的智能助理。
也因此,百度文库的 AI 功能深受用户喜爱和好评。截至目前,累计 AI 用户已超1.4亿,AI 新功能使用次数超15亿,还在最新一期 AI 产品榜中位列国内总榜第一名。
数据来源:AI 产品榜 aicpb.com
文心大模型的全面重构,让百度文库获得「新生」的同时,更让用户体验有了脱胎换骨的变化,自然能够获得青睐。
内容创作终于有了 AI 原生应用
百度文库内置的各项 AI 能力都瞄准了一个个垂类场景,已经足以满足用户的多样化内容检索、总结与问答、跨模态创作需求。在大会上,百度文库针对更加深层次的科研、学术需求,又推出了全新的 AI 原生应用。
该应用名为「橙篇」,它在 PC 网页和 PC 客户端推出,是行业首个集专业知识检索和问答、超长图文理解和生成、深度编辑、跨模态自由创作的综合性 AI Native 产品,显然又是一个「多面手」。
PC 网页端的「橙篇」界面如下所示:
网址:https://cp.baidu.com
通过调用背后百度文库、百度学术以及全网数十亿的专业信息和文献资料,用户首先可以在「橙篇」上进行学术搜索和 AI 全网智能检索。
学术搜索。
全网搜索。
在实际操作中,找到很多相关、不同类型的资料后,用户再进行粗读整理是一个复杂、漫长的过程。「橙篇」则具备了行业领先的超长文档理解能力,用户可以进行超大量、超多格式、超长内容文档的理解、总结与问答,最多可以输入100个不同格式文件,包括 PDF、Word、图片、链接等。
输入不同格式的文件。
文档要点总结。
问答。
在超长图文生成上,「橙篇」行业率先上线超长篇专业长文生成能力,并提供「输入主题生成」和「参考范文写作」两种长文写作方式。用户输入一句话主题或上传范文,AI 将自动理解并快速生成超长篇专业长文。
同时可以对任意模块上传指定材料重新生成编辑,比如实验方法、实验数据、统计结果、实验分析等专业内容,大模型将进行学习并迭代到长文内容中,还能自动生成专业图表。
之后,用户还可以进行深度编辑和整理,不仅能够润色、扩写续写、还提供一键全文校正、用户指定模版整理全文格式、参考源梳理和生成、智能编辑等功能。
文档润色。
一键全文校正。
在专业文本创作之外,「橙篇」未来也将上线跨模态内容创作能力,包括 AI 思维导图、AI 漫画、AI 有声画本等。通过各项 AI 原生能力,「橙篇」将为创作者提供更自由、便捷和沉浸式的服务。
此外,「橙篇」还将进一步改变人们对内容创作的传统认知,检索、生成、编辑、整理多位一体,省去了在不同软件之间来回切换的麻烦,更能体验到一站式 AI 创作能力。
结语
当下,大模型之间的竞争焦点正在发生改变:逐渐从上半场的规模性能比拼,向下半场的垂直应用、商业落地、生态构建等层面转进。当重复造轮子的百模大战走到头时,整个行业的转向势在必行。
百度文心大模型对包括百度文库在内所有产品的重构是这一趋势的真实写照,不再只看模型参数突破等「硬」实力,转而更加重视能否精准契合用户需求、模型面对任务时能不能解决好、执行过程是否自然友好,这些「软」实力变得越来越关键。
尤其是在学习工作、家庭教育、兼职赚钱这些与普通人联系紧密的场景中,大模型赋能的 AI 能力感知最强。而拥有海量用户的百度文库凭借丰富的内容创作场景,为 AI 功能提供了天然的试炼场。
百度文库在基于文心大模型重构时,执行环节借助混合专家模型(MoE)和检索增强生成(RAG),合理分配和调用多个不同尺寸模型,实现跨模态、跨格式内容生成,还能把生产的内容自动化组装成用户所需的最终可用成品,真正实现一键获取。同时,面向创作场景和功能时更聚焦,在设计与开发过程中端到端地解决问题。
这样做的效果也很明显,百度文库成为了 AI 重构最彻底的产品,潜移默化地改变着人们的学习、办公和创作习惯,让人人都可以体验漫画、小说等专业性很强的内容创作,整个行业的准入门槛变低了。全方位 AI 能力加身的百度文库也越来越具备「超级应用」的雏形。
有消息透露,文心大模型5.0将于明年发布。很多人猜测,5.0版本将发力多模态,在文本、图像之外,将逐步实现与视频、音频、代码等更多形式的互生转换,这也许将为百度文库提供更全面的能力支持。未来,百度文库的 AI 功能有望覆盖更丰富的内容创作形态,文生视频也许将以更强大的面貌出现。
可以预见,随着百度文库 AI 功能持续丰富和增强,内容创作领域会加速进入 Next Level ——任何人都能胜任,什么任务都能搞定。