巨头混战Agent，押注背后是真未来还是新泡沫？

发表评论

A+

所属分类：科技

摘要

在技术研发上，阿里云的通义千问 Qwen 系列大模型为 Agent 应用提供了强大的基础能力，还开源 Qwen – Agent 框架及多个Agent 应用示例，降低开发门槛，并融入多模态技术丰富交互体验。…” />

XM外汇行业评论：

文 | AI大模型工场，作者｜西梅汁，编辑｜星奈

但实际上，

文 | AI大模型工场，作者｜西梅汁，编辑｜星奈

据业内人士透露，

今年，被不少业内人称为“Agent元年”。

XM外汇财经新闻：

这一年，AI Agent的概念像一枚火种，从初创公司Manus的Demo视频点燃，到字节跳动用“扣子空间”将Agent化身为“裂变插件”，嵌入日常场景；百度“心响”定位通用超级智能体APP，覆盖200+任务类型，试图实现多变任务的一站式处理；阿里的“心流”项目则深入研究Agent的人机协同效率，从电商客服到企业服务逐步铺展；腾讯继续秉持平台战略，构建Agent开发生态。

XM外汇用户评价：

与此同时，融资市场也被点燃。据来觅 PEVC 数据，自 2024 年以来，全球 AI Agent 赛道的融资金额已突破 665 亿元人民币。其中，自动驾驶、人形机器人、大模型等赛道最吸金，头部机构频频下注。

但如同几乎每一场AI浪潮一样，泡沫的阴影也在飞快靠近。

综上所述，

技术的跃迁是否足够支撑其野心勃勃的应用想象？使用者真有“刚需”到愿意持续留存并为之付费？这场由巨头领舞的盛宴，究竟是迈向AI大规模落地的新起点，还是又一轮概念堆叠下的虚火？

一、Agent何以成为巨头必争之地？

XM外汇消息：

在国内大模型发展逐步稳定、通用对话特性趋同的背景下，Agent像是被视作“后提示词时代”的新概念。它以任务导向、自主规划和多步骤流程执行为特征，为模型的可用性打开了新空间。

更重要的是，

过去，使用者需要靠提示词技巧与模型反复周旋，而现在，Agent可在给定目标下自动执行一系列动作，更符合大家对“AI助理”的直觉期待。

然而，

Manus的出圈并非偶然，它采用多智能体系统架构，能动态调用不同领域的专用大模型，实现“1+1>2”的效果。这就有点像交响乐团的指挥，协调各个乐器组，让它们共同演奏音乐，不仅避免了单一模型在能力上的局限性，还有效提升了任务处理的能力和效率。

但实际上，

展开全文 XM官网

同时Manus的这种交互模式，标榜“端到端执行任务”，直接戳中了行业长久以来的痛点：大模型虽强，但不会用。在其带动下，国内大量创业项目涌现，部分采用开源框架如LangChain、AutoGen，部分自建执行链路和插件体系，追求更加本土化的场景匹配与使用者体验。

其实，

大厂也迅速响应，尤其在素材、办公、知识管理等相对标准化的应用领域推进Agent化转型。

XM外汇快讯：

字节“扣子空间”聚焦创作者自动剪辑与素材发布，百度借“心响”深耕搜索与问答任务链，阿里探索电商、客服、财务等垂直系统嵌入，腾讯则将Agent能力集成至企业微信、腾讯文档、混元平台API中，意在形成多层级的企业服务生态。

简而言之，

在这些探索背后，是国内AI产业对“大模型+场景”的现实需求。同时，更重视端到端的体验。Agent不仅是画面重构，更被视为商业模型升级的关键跳板。

Agent的爆发，并非偶然，它在多个层面踩中了时代的脉搏。

从技术演进来看，大模型能力的提升为Agent供给了基础算力保障。GPT-4之后，无论是语言理解上，还是多模态能力上，都达到了一个足以支撑多变任务调度的门槛。

从某种意义上讲，

其次是交互模式的进化。在语音助手、聊天机器人之后，Agent的出现供给了一个更具沉浸感与目的性的交互路径。不仅回应使用者的困扰，更主动推进任务流程。相比于过去“各位问我答”的插件形态，Agent承诺的是“交付结果”的服务形态。

可能你也遇到过，

同时，对巨头而言，这是一道无法绕开的必答题。过去两年，大模型技术已经趋于“共识化”，能力边际变小、差异化成本变高，“百模大战”的价格战和性能战耗尽了耐心。

而Agent像是一条新通道，它不仅能撬动新应用，还可能打开存量业务的变现瓶颈。更关键的是，它落地的单位颗粒度小，具备飞快试错、飞快迭代、飞快验证商业价值。

总的来说，

Agent，似乎成为了下一阶段“技术找场景”的试金石。

XM外汇报导：

二、繁荣下的AB面：技术突破还是“高级自动化”？

更重要的是，

但是在这股热潮之下，并非没有质疑。

华丽演示背后往往忽略场景条件和人工干预。许多“自助手写帖子”或“自动化办公”案例，前提是有精心编写的提示词、可靠的网络资源和大量API。

综上所述，

实际部署时，Agent需要处理环境不稳定、异常处理和及时纠错等困扰。不少技术人士指出，目前绝大多数Agent产品，距离真正的“智能体”尚有不小差距。路径规划、插件调用、多轮交互确实比传统对话系统更进了一步，但核心逻辑仍是任务自动化的增强版。

XM外汇财经新闻：

换句话说，许多所谓Agent，更像是“流程机器人”套了一个AI壳。也就是说，真实场景中的连续任务与演示环境相差甚远，常常需要人工“监督+修正”，效率提升有限。

尽管如此，

从技术底座看，Agent的运行强依赖于几个关键环节：环境建模、记忆系统、长期目标拆解能力、多模态融合、对接插件链的稳定性等。遗憾的是，这些环节没有一个是完全“成熟”的。

根据公开数据显示，

而从使用者体验出发，Agent带来的改变，往往不如想象中“革命性”。大家仍需学习如何“正确地”提示Agent，才能获得理想结果；不少产品陷入“体验上像是套壳Siri，底层上是多变Prompt拼贴”的窘境。更有甚者，在以“聪明感”吸引使用者的同时，背后的调度逻辑与“AI”关联甚微，几乎只是流水线式脚本执行。

令人惊讶的是，

换言之，Agent确实比传统Bot更强大，但要说它已经构成“生产力革命”的新转折，仍言之过早。

来自XM外汇官网：

那么在面对这些挑战，创业公司和大厂分别采取了不同策略。以Manus为代表的新锐队伍，倾向于前沿探索，它们往往开放申请账号早期使用者，依托最新架构集成API插件，追求特性极限。

Manus自身就号称“多模型架构+后台实时监控+可回放会话”，试图给使用者供给一个“看得见、可操控”的Agent。但事实上，部分使用者社区评论已经质疑其稳定性，称有部分特性只是包装，很多执行依赖已有大模型或手动准备的插件。

相比之下，字节、百度等大厂则走更稳健的路径，它们往往先将Agent特性融入已有产品（像智能客服、办公软件），以部件化插件形式供给服务，同时还在内部持续打磨系统。

不可忽视的是，

如百度推出的“链路学习”场景、腾讯开放的企业办公助手等，更多强调闭环业务与有保障控制。大厂有资源建立大规模测试和有保障审查，因此在落地前强调可控性和行业适应度，而不是一味追求技术。

据相关资料显示，

总的来说，Agent在概念层面吸引了众多目光，但其技术短板同样显而易见，记忆与上下文管理不足、多任务泛化困难、对动态环境的感知不强、对结果的可靠性缺乏保证等等。Manus等创业者的尝试激发了想象，但是否可持续盈利和规模化，还有待进一步探索。

简而言之，

三、巨头混战：战略卡位与差异化求生

站在用户角度来说，

不同的巨头，在Agent赛道上有着完全不同的下注策略，但它们的底层意图却高度一致：以Agent为抓手，构建出人与产品、人与服务、人与平台之间的关系。

从时间上看，字节是几家巨头中最早高调入场Agent概念的玩家。早在2023年底，字节就上线了豆包智能体平台，主张“人人都能造Agent”。

到2024年初，其推出的“扣子”平台进一步降低了智能体开发的门槛，通过可视化流程、拖拽组件、内置插件等模式，让非技术背景的个人也能创建特性丰富的智能体，并一键发布至豆包、飞书、抖音等多个渠道。

换个角度来看，

“扣子”本质上是一个智能体应用广场，它整合了插件系统、工作流引擎、知识库接入和多端发布等能力。据 2024 年 12 月消息，扣子专业版集成了 1 万 + 插件，可调用国内流行的大语言模型，且扣子 1.5 版本还集成了视觉理解、音乐、图像生成等模型。

不仅如此，据公开数据统计，截至2025年第一季度，豆包平台上已上线智能体超过10万个，其中大部分来自个人开发者和中小企业，体现出较强的生态活力。在产品逻辑上，字节试图延续其素材平台的成功经验，通过低门槛创作插件和算法分发机制，激发长尾智能体的活跃度。

XM外汇用户评价：

虽然Agent的交互属性与素材消费不同，但这种平台化打法在推动生态建设、吸引开发者上具备一定先发优势。

从某种意义上讲，

腾讯在Agent方向的布局体现出“平台+能力”的战略思路。自2024年底起，大模型相关业务统一划归至CSIG，Agent被正式纳入腾讯云的大模型战略，成为核心落地方向。当前已形成双平台体系：面向C端使用者与轻量开发者的“元器”，以及服务企业级需求的“腾讯云智能体开发平台”，分别覆盖素材创作与业务重构两大场景。

与其相反的是，

在实际产品落地上，腾讯正在拓展Agent的行为边界。前段时间，推出的Qbot浏览器，具备文件转换、应用执行等能力，未来可望与本地软件打通，成为使用者常驻的多特性助手。

简要回顾一下，

在企业服务层面，腾讯强调Agent对高多变度、高知识密度行业的改造潜力，已在汽车、金融、零售、医药等多个行业展开场景合作。技术上，腾讯聚焦Agent的自主决策、插件调用与工作流编排能力，通过整合内部AI技术栈，推动从“可调用”向“可协作”演进。

尤其值得一提的是，

当前的挑战来看，模型自主性仍待提升，多变任务的拆解执行仍需框架与工程体系配合，客户对Agent的认知也需要通过多种模式弥合。

据业内人士透露，

阿里在Agent方向的思路，延续了其在企业服务领域的深耕路径。自2023年起，钉钉就实行试点智能助理特性，2024年进一步升级为“AI助理中心”，并在2025年开放智能体开发框架，容许企业定制自己的数字员工。其核心优势在于：紧贴企业实际需求，强调数据私有、有保障可信、系统兼容。

不可忽视的是，

在技术研发上，阿里云的通义千问 Qwen 系列大模型为 Agent 应用供给了强大的基础能力，还开源 Qwen - Agent 框架及多个 Agent 应用示例，降低开发门槛，并融入多模态技术丰富交互体验。

今年3月，夸克App推出了AI 版，并首创了“智能体中枢”特性，将其转型为多模态Agent平台，使用者通过该平台具备直接获取AI所执行的任务结果，而不仅仅是传统的搜索或聊天。4月，阿里又推出了“心流”智能体应用，通过高级研究模式帮助使用者自动完成报告编写、代码生成等多变任务。此外还在外贸、智能客服等领域推出多种 Agent 应用。

除此之外，阿里智能体平台 “通义万相” 为个人创作者和中小企业供给不多变易用的 Agent 开发插件，同时通过阿里云和百炼平台赋能企业客户；在人才与团队组建上，招聘前 Salesforce 集团副总裁许主洪等人才，还开启大规模招聘潮；在生态构建与合作上，阿里云智能集团整合各方资源确立 “AI + 场景” 深度融合战略，与众多企业拓展合作关系，推动 Agent 应用落地。

必须指出的是，

百度作为最早布局大模型的公司之一，在Agent方向的探索也在持续推进。在create2025百度AI开发者大会上，推出了“心响”APP，是一款以“AI任务完成引擎”为核心的通用超级智能体APP，致力于通过智能化手段处理使用者日常生活中的多变需求。已经覆盖了200多个任务类型，未来计划扩展至10万种以上。

可能你也遇到过，

同时，百度的文心智能体平台为零代码基础的使用者供给了全链路的任务创作与经营服务，容许海量插件调用，推动了Agent生态的不断发展。

从某种意义上讲，

同时，百度全面拥抱MCP协议，将这一协议应用于文心大模型、千帆平台及核心产品，如百度搜索和百度文库等。这一协议使得AI应用与外部世界的连接更加紧密，进一步提升了Agent在任务规划和调度中的精确度与效率。此外，百度还发布了文心大模型4.5 Turbo和X1 Turbo，为优化任务执行的速度、性能和性价比，推动Agent技术的持续进步。

必须指出的是，

不仅如此，百度通过智能云千帆平台，为企业供给全面的MCP容许，鼓励开发者在平台上开发自己的MCP组件并与外部业务系统对接，推动MCP生态的繁荣。

反过来看，

总体来看，Agent 并非一个孤立的技术标签，而是模型能力、应用框架与使用者需求三者交汇的产物。随着大模型差异化逐步缩小，各家企业在Agent上的布局也反映出各自的生态定位与资源。

通常情况下，

字节强调素材驱动与生态构建，腾讯重视能力组件与业务整合，阿里深耕产业落地与定制化服务，百度则以产品闭环和底层模型为基石。

这场Agent竞速没有明确的终点，它更像是大模型商业化的一场阶段性演进。

四、真未来还是新泡沫？

Agent的确具备塑造未来产品形态的潜力，它融合了模型能力、交互逻辑与任务调度，使AI从“回答者”进化为“行动者”。但在通往未来的路上，每一个技术热点都难免遭遇泡沫期的“高估—失望—再估值”周期。

概括一下，

今天的Agent热，既是技术突破的阶段性结果，也裹挟着巨头对增长焦虑的投射。资本、流量、研发资源的倾斜，使其呈现出“预期大于现实”的膨胀状态。那些缺乏稳定场景支撑、无法形成使用者复购的Agent应用，很可能会在下一轮融资窗口关闭时迅速退潮。

概括一下，