水无形,但有神。 文 | 佘宗明 人们到底需要怎样的 AI? 在 AI 正当「潮」的时下,这是个越来越值得思考的问题。 对身为文字工作者(俗称码字的)的我来说,我理想中的 AI,是个善解「人」意的协作伙伴,在我需要之时,它无所不能,在我需要之处,它无处不在。 几个月前,我曾看到科技预言家凯文 · 凯利的一段话:J.K. 罗琳是个天才,她创造了哈利 · 波特的世界,可即便她有如此大的想象力,也依然无法独自制作 7 部哈利 · 波特电影,「但有了 AI,一个人是可以实现这一点的。」 AI 技术飞跃,正让「未来已来」四个字变得具象化。 AI 技术的进步,该体现在能帮 J.K. 罗琳「独自制作 7 部哈利 · 波特电影」上,也该体现在能帮上班族将会议录音自动转为文档还形成结构化知识图谱、帮学生党将网课里的知识点自动转录分类上——变成人们手中的「魔法棒」,就是人们期待中的 AI 模样。 01 不得不说,过去 3 年,尽管花哨概念层出不穷,但在用户需求已从简单的信息检索升级为复杂的内容创作、知识管理、跨模态协作的背景下,很多 AI 应用却显得有些滞后,「善于交互,难于交付」成了普遍性问题。 当前 LLM(大语言模型)的主流交互形态仍以 ChatBot(聊天机器人)为主,可 ChatBot 的作用止于 Chat(聊天),你让它帮你生成文案,它说 OK,你让它再帮你做成 PPT,它可能会皇后娘娘附体——「臣妾做不到啊」。 现实中,很多网民手头的 AI 工具不少,但可用地方不多:找资料时,还是得同时在文档工具、网盘、专业数据库里来回找;设计时,经常要在 PS、PR、AI、AE 工具中频繁切换 …… 究其原因就在于,市面上的许多 AI 工具都存在共同的硬伤:1,公私域数据割裂:企业内部知识库与互联网公开数据无法联动,导致 AI 输出缺乏深度与精准性;2,多模态能力碎片化:图片、语音、文本,需调用不同工具处理;3,交付链路断裂:从创意生成到落地执行缺乏连贯性,不得不反复切换平台才行。 公私域数据的高效整合能力,跨场景跨设备的无缝体验,才是用户内容生产与消费时需要的 AI 加持。该如何实现这两点要求? 去年 11 月,在 2024 百度世界大会上,百度发布的「自由画布」,就为此提供了样本。 百度创始人李彦宏当时就说,自由画布是个由文心多模态大模型加持的万能白板,能激发人们的无限灵感和创造力,「因为自由画布,每个人都可以是漫画家、短视频导演。而且,这不是期货,而是立即可用的现货!」 那,AI 对内容创作的助力还能更进一步吗?百度说「能」,然后掏出了超级利器。 在 4 月 25 日的 2025 百度 Create AI 开发者大会上,百度文库联合百度网盘推出了面向内容生产与消费场景下研发的内容操作系统——「沧舟 OS」。
▲「沧舟 OS」是全球首个内容操作系统。 那些还在为解决内容创作交付问题辗转于一堆 AI 应用之间的用户,在任何时间、任何地点、任何终端一站式实现深度交付的期许终于不再遥不可期,因为沧舟 OS 就差把「无所不能,无处不在」写在脸上了。 而沧舟 OS 的底气,则是「深度思考 + 深度交付 + 公私数据融合 +MCP 生态」的四维支撑。 02 什么是「无所不能」?说具体些,就是 AI 要从能解决单点问题变为能提供全链路智能服务。 真正「无所不能」的 AI,绝不该是「炫起来很酷,用起来想哭」,而应是让用户体验到方便好用的「N 次方」:用语音口述方案后,能自动生成 PPT 大纲或 Word 脑图,还匹配图片素材;撰写报告时,能自动关联文库里的白皮书、网盘中的会议录音和学术平台上的论文 …… 这在以往自然是奢望,但技术进步已将其变为现实。以 Chatfile Plus 为核心组件、以「三库(文库公域专业资料库 + 经用户授权的网盘私域数据库 + 用户记忆库)一平台(百度学术平台)三器(阅读器、编辑器、播放器)」为依托的沧舟 OS,夷平了数据孤岛与能力分割的壁垒。 三库一平台的融合,打通了专业知识、个人积累和科研资源,构建起了知识全息图谱;Chatfile Plus 与三器的协同,实现了多模态内容的「元素级拆解」与「向量化重组」,可支持文档 /PPT/ 视频 / 音频的混排创作和编辑。 再加上 AI Agent 矩阵将数百项 AI 能力集成工具层,也让「智能拆解 - 创意生成 - 格式转换 - 多端适配」的全流程交付变得更容易。 需要看到的是,基于沧舟 OS,在自研技术沉淀与生态合作创新基础上,百度文库和百度网盘推出了极具代表性的能力:GenFlow 超能搭子、AI 笔记。 作为 WorkFlow(工作流)的升级,GenFlow 中的「Gen」既有 Generative(生成)之意,也有 Genius(智慧)之义。它就像贾维斯附体,干起活来很聪明,具备需求识别与任务分发中枢的属性,能形成自适应服务链,为用户提供端到端的智能解决方案——这点可能会让人联想到 1 个多月前爆火的 Manus。 「GenFlow 超能搭子」跟其他的多智能体协同平台有相似的原理,都是利用大模型来分析用户 query(提问查询)中的意图并帮其完成整个工作流。在此过程中,「GenFlow 超能搭子」会因需调用文库和网盘上的那些适配工具。 但 GenFlow 超能搭子的优势在于背靠沧舟 OS 凭借算法优化与预处理将任务执行效率提升至「分钟级」、规避模型幻觉和输出瑕疵的底层能力,还有「三库一平台」的独一份加持,输出结果更加稳定、高效和符合用户习惯。 比如,我是个即将高考的高中生,想复习网盘里的学习资料,提出要求后,它可以拆解需求,梳理考点、总结重点、画出思维导图、预测考题、出模拟试卷等。 ▲在帮学生备考方面,「GenFlow」可以干很多事。 在沧舟 OS 加持下,百度网盘也全面升级了 AI 笔记,对于职场人和学生等有学习需求的人群来说,它完全称得上一句「真香」。 试想一下,考研党在网盘里找到学习视频,点击右侧「AI 笔记」按钮,接着视频播放器右侧自带笔记编辑区域,可实时生成逐帧摘要、思维导图,并关联相关文献,点击关键帧即可跳转至重点内容,点击时间截就能跳转到笔记对应位置 …… 这不比上李永乐视频课前面听了后面忘要好多了? AI 价值评判的尺度有很多,「好用才是硬道理」是至关重要的一个。 03 什么是「无所不在」?沧舟 OS 的「沧」字已道出了其中关键:其形态「像水一样」,能支持不同能力调配和交互界面。 百度副总裁,文库事业部、网盘事业部负责人王颖介绍道,沧舟 OS 跟其他操作系统的区别是,其他操作系统主要的是提供「大脑」,上面那些应用程序是「四肢」,沧舟 OS 则是既有大脑(智能决策中枢)也有四肢(完整工具链)的「超能人」。 过去 Windows 是多窗口界面,是因为没有通用性,只能底座是底座、应用程序是应用程序,但沧舟 OS 却是端到端的解决方案提供者,展示形式就像水一样因需而变,水放到圆形杯子里形状就是圆形,放到方形盒子里就是方形,但人们又离不开水。 这意味着,沧舟 OS 突破了常见操作系统的形态桎梏,变得更「活」。 这兴许才更契合人们的需要:现实中,广告人要设计营销方案,需要的不是在「脑暴 - 手绘草图 -PS 精修 - 视频剪辑」各环节都去找不同工具,而是让 AI 应用形态随场景自适应。 就此看,交互界面随场景而变,比如办公场景可以用自由画布,学习场景可以用 AI 笔记,由用户需求决定应用形态,来得颇为贴心。 现实中,很多老师在 PC 端完成教案后,希望将修改思路同步到多端等。系统以柔性架构融入 PC、移动端、IoT 中,因此很有必要。 现实中,有的律所想将自身案例库跟关联法条结合,生成培训视频。系统输入可涵盖语音、图片、文本,输出支持图文影音多模态,实现「用户指哪就打哪」,就变得十分重要。 「无处不在」说起来容易,做起来难:若没有 AI 能力动态部署与弹性伸缩、根据不同场景需求自由组合与拆分的能力,若没有跨模态向量空间统一化,实现「语音指令生成图文内容」等跨模态交互的能力,很难实现。 但「无所不在」的指向很清晰,那就是:让 AI 的鞋子主动匹配用户需求的脚,而不是削足适履。说人话就是,要让服务跟着用户需求走。 04 值得注意的是,从「无所不能」与「无处不在」两个维度拆解沧舟 OS 系统时,MCP(模型上下文协议)都是个绕不开的字眼。 MCP 是当下的「AI 新贵」。3 月初 Manus 走红后,就间接带火了 MCP ——虽然没直接采用 MCP 框架,但 Manus 展现的多 Agent 协同能力契合了用户对 AI 生产力的终极想象。 截至目前,OpenAI、谷歌、Anthropic 等 AI 巨头都拥抱起了 MCP。 为什么? 因为 MCP 托起了 AI 领域的「书同文、车同轨」愿景:它统一了各家大模型原本差异化的 Function Calling(函数调用)标准,形成通用协议,能兼容无缝适配 GPT、Claude 等不同模型,堪称「AI 界 HTTP」「大模型界 USB-C 接口」。 MCP 通过 Client(客户端)、Host(应用)、Server(服务器)将大模型与外部交互抽象成「客户端 - 服务器」架构后,那些 MCP Host 无需预编码适配,就能直接使用 MCP Server(官方、三方),像 USB 那样即插即用。这样一来,在聊天界面就能实现「对话即操作「的革新体验,给用户「AI 真的在动手干活」的既视感。
▲谷歌 CEO 桑德尔 · 皮查伊说:要不要 MCP,这是个问题。 而百度文库与百度网盘,就基于沧舟 OS 率先将 MCP 协议充分运用到了产品与生态的链接上,构建起了开放网络,既将文库网盘的核心能力开放出去赋能生态,也接入外部更多能力持续提升自身产品体验。 在文库网盘成为 MCP Server 后,那些接入其数据与能力的应用都可享受到更大容量、更快速度、模态更自由的内容存储、管理、搜索、总结服务。 像三星手机,就凭借接入百度文库 & 网盘的能力,在手机语音助手界面直接实现了文件的上传网盘备份、云上分享、文档摘要总结和内容问答等功能,手机自身对大文件、多文件难以批量备份与分享的问题也迎刃而解。 百度文库 & 网盘则凭着灵活精准地调用内外部模型和工具,满足用户一站式完成长文、研报、PPT、AI 绘本、海报等不同形式、模态内容的获取和创作之需。 某种程度上,这延续了百度开源文心大模型 4.5 系列的开放姿态。 到头来,正是因为 MCP 生态的「资源互通、技术共享」抬高了能力天花板,才有沧舟 OS 带来的「无所不能」;正是因为 MCP 生态的「网络效应」,才有沧舟 OS 带来的「无处不在」。 05 凯文 · 凯利曾写道:最深刻的技术是那些看不见的技术,它们将自己编织进日常生活的细枝末节之中,直到成为生活的一部分。 很多底层基座式技术最终变成社会数字基础设施,就印证了这点。 不难想见,随着 AI 时代全面到来,「无所不能」的技术底座与「无处不在」的生态网络交织而成的沧舟 OS,最终会变成内容生产与消费的「新基建」,润物无声。 但它撬动的内容产业生产力变革影响注定会很深远:大众也许不解何为跨模态协作,何为多 Agent 调用,何为知识库整合,但伴随内容创作门槛变低、知识管理难度降低而至的变化却看得见。 有了百度给的那支「AI 神笔」后,就算不是马良,很多人照样能在「画布」上画出瑰丽多彩来。 AI 革新了内容生产与消费的范式,也会为内容创作带来新机会,为内容产业打开新空间。 可以预见,在不久的将来,在知识与内容这片「沧海」上,会有越来越多人乘着 AI 这艘「方舟」,一苇以航,乘风破浪。
|