当我们审视人工智能发展的轨迹时,会发现每一次技术标准的确立都会带来行业格局的重新洗牌。近期发布的MCP(Model Context Protocol)正是这样一个具有里程碑意义的协议,它不仅仅是一个技术规范,更是重新定义了智能体(Agent)生态系统的基础架构。
MCP带来的核心技术革新
让我们首先理解MCP在技术层面的突破。传统的智能体框架主要围绕工具调用展开,而MCP引入了一个全新的概念维度。最显著的创新是引入了"Resource"对象,这改变了数据交互的基本模式。以往我们需要通过接口调用来获取数据,现在可以直接将数据流推送给模型。更重要的是,当数据更新时,系统能够主动推送更新内容。想象一下监控日志的场景:当日志更新时,系统会持续推送给模型,模型可以自主判断是否需要响应,比如在出现报警时自动调用相应的处理接口。
在规划层面,MCP提出了将Prompt也作为一种资源供模型调用的概念。这个设计哲学的转变非常深远:系统不再仅仅提供工具能力,还会告诉模型如何使用这些能力。这种从"给予能力"到"指导使用"的转变,体现了对智能体自主性和指导性平衡的深度思考。
另一个技术创新是Sampling机制的引入。这打破了传统的被动调用模式,工具可以主动调用Agent,实现了真正的Agent到Agent(A2A)的协作状态。智能体网络从此不再是一个静态的工具集合,而是一个有机的、动态的、智能的协作网络。
对Agent平台架构的重构影响
当我们把视角转向Agent平台时,需要理解平台的本质作用:构建和管理智能体。目前市场上的智能体主要分为两大类型:自主规划型(Autonomous Agent)和工作流型(Workflow Agent)。前者如GPTs,依靠模型自主规划执行路径;后者如Dify、扣子、bisheng等各种工作流平台,通过人工设计的流程来控制执行步骤。
MCP发布后,业界出现了一种声音认为工作流模式将被淘汰,因为它过于死板,未来必然是模型自主调度的天下。然而,这种观点忽视了企业级应用的核心需求。对于消费级市场,自主规划的智能体确实更有吸引力,但在企业环境中,工作流模式具有不可替代的价值。
企业级应用对可控性有着严格要求。一个标准的业务流程应该按照既定的五个步骤执行,如果让大模型自主规划,今天可能是三步,明天变成四步,后天又是五步,这种不确定性在企业环境中是无法接受的。许多业务场景对格式要求极其固定,对准确率要求达到百分之百,某些关键步骤必须经过人工确认才能继续,这些都需要严格的流程控制。
从经济性角度考虑,如果一个工作流程已经固化和优化,让模型每次都重新规划和拆解任务实际上是资源浪费。企业更希望避免这种重复的推理开销。
垂直行业还存在大量隐性知识壁垒。许多企业试图让业务专家参与到大模型应用开发中,但这个过程仍然困难重重。当前主要还是IT部门在主导,业务部门的深度参与仍需要更多的桥梁和工具。
重新审视"Less Control, More Intelligence"
OpenAI在o系列模型发布后提出了"Less Control, More Intelligence"的观点,认为给系统的控制越少,自发产生的智能越高。这个观点需要更细致的理解和应用。
这个理念在训练阶段是正确的。就像学生时代,我们应该鼓励自主探索,根据兴趣去学习。强化学习中的自主探索和自主发现在训练阶段确实能产生更好的效果。但在应用阶段,逻辑应该反过来:我们应该先确保有足够的智能,然后再逐渐减少控制。这就像职场环境,我们不能允许完全的自由发挥,必须有公司规则和流程约束。
随着模型智能水平的提升,未来是否会完全不需要控制?答案并非如此简单。私有领域的专业知识获取仍然极其困难,企业内部一个老专家的流失都是巨大损失。显性知识本身也在不断增长,经济性考量也不会消失。因此,工作流模式将长期存在,这是基于实际应用需求的必然结果。
MCP对平台竞争格局的重塑
MCP的发布对现有平台带来了显著的竞争格局变化。以往像Zapier、Make等平台的优势在于丰富的工具生态,但MCP将所有工具拉到了同一起跑线上。当所有平台都能访问相同的工具生态时,差异化竞争就必须回到更本质的层面:场景价值的深耕、用户体验的构建、企业级管理能力和数据治理能力。
数据治理能力尤其容易被忽视,但在企业应用中极其关键。企业内部的数据往往比较脏乱,需要大量的基础工作来清理和规范,这需要结合AI能力以及传统的OCR、NLP等技术来提供支持。这些看似不够炫酷的"苦活累活",实际上构成了企业级应用的护城河。
展望:从工具到独立参与者的演进
短期内,我们将看到工具从被动响应到主动参与的转变。工具不再仅仅等待被调用,而是可以主动触发工作流的运行,实现主动交互和异步协同。这带来了一个有趣的身份认证问题:如果Agent作为数字员工存在,它是否需要自己的社交媒体账号?是否需要自己的计算资源、存储空间和知识库?国外已经有专门的SaaS公司在为Agent提供数字身份服务。
工具数量的增长将带来指数级的能力提升。两个工具只有一种组合方式,但十个工具可以产生两两组合、三三组合等多种可能性,这种组合爆炸将创造出前所未有的能力可能性。
这种快速发展也会带来新的挑战。工具描述的优化可能会变成新的SEO战场,付费工具可能会通过夸大描述来获得更多调用机会,但这对最终效果并无帮助。如何评估相似工具的质量,如何选择最适合的工具组合,这些都需要新的解决方案。
MCP Server可以被理解为专门给大模型使用的APP。传统APP面向人类用户,而MCP Server面向模型用户,它不仅提供工具,还提供使用说明书,告诉模型如何组合使用这些工具。
解决企业应用的核心难题
企业面临的一个长期难题是如何让业务人员真正参与到智能化工具的使用中。传统的工作流平台或RPA系统,业务人员大概率不会直接使用,通常还是需要专业的实施团队来交付。要让业务人员学会并自主操作这些工具仍然比较困难。
基于MCP的通用Agent可能提供了解决方案。当Agent的能力通过丰富的工具生态变得足够强大时,普通业务用户可能只需要发出业务指令,结合模型强大的推理能力和完整的工具生态(包括外网和企业内部软件),就能直接完成七八十分的工作质量。
在这个过程中,我们可以将成功的案例固化成工作流,进一步优化成垂直领域的专门Agent。甚至可以通过自然语言反馈来调优这些Agent,并在企业内部分享这些小型Agent。只有通过这种方式,才可能真正让业务人员参与进来,实现智能化工具的普及应用。
长期愿景:角色化的通用Agent
长期来看,我们可能会看到通用Agent的角色化趋势。现在的Cursor主要用于编程,但未来它可能不仅仅是编程工具,而是成为面向工程师群体的通用Agent。工程师可能会通过它来写代码、查询技术文档,甚至查询股票信息,因为MCP使它能够接入所有类型的工具,从而成为特定人群的统一入口。
Result-as-a-Service的商业模式也值得关注。传统的企业服务很难盈利,因为卖的是工具而不是结果。现在越来越多的公司开始用AI来售卖结果而不是工具,这可能会对企业服务市场的商业模式产生重大影响。但这需要谨慎选择场景,确保能够实现真正的业务闭环,而不是概念上的闭环。
技术实践中的挑战与机遇
在具体的技术实践中,我们发现了许多模型无法很好处理的场景。以投标书撰写为例,这是一个典型的超长内容生成任务,需要生成几十万字、几百页的文档。模型在处理这类任务时面临多重挑战:超长内容生成能力有限、生成内容过于AI化、对招标文件需求拆解不够精准、难以结合企业产品特性做针对性响应、溯源能力不足、格式转换困难等。
这些挑战指向了一个重要方向:开发真正实用的MCP工具比搭建MCP平台更有价值。未来的竞争优势将体现在能否开发出解决实际问题的专业工具。
对于领域知识注入这个核心问题,基于垂直领域的强化学习理论上可行,但实际操作中面临反馈模糊的问题。与数学和编程不同,真实业务场景的反馈往往是模糊和主观的,这使得强化学习难以获得清晰的优化信号。
更现实的解决方案是通过SOP(标准操作程序)沉淀的方式。让业务专家深度参与,不断总结经验,让模型分析执行过程,根据用户反馈迭代优化,最终沉淀成标准操作程序。这种轻量级的方式比将知识训练到模型中更加实用和可控。
上下文管理的技术突破
更长的上下文处理能力是当前技术发展的关键瓶颈。目前许多模型声称支持百万级token的上下文,但这往往只是工程上的技术支持,而不是真正的模型能力。模型的训练数据中并没有足够长的内容,导致在处理超长上下文时指令遵循能力下降严重。
真正的长上下文能力需要在模型训练阶段就包含足够长的训练内容,这是下一代模型需要重点突破的技术方向。在企业级应用中,这种能力的重要性怎么强调都不为过。
结语:持久战的准备
从实际测试结果来看,目前最优秀的模型在复杂企业场景中大约能达到七八十分的水平,开源模型如千问三代约为五十分左右。这意味着要在企业内部实现私有化部署并达到理想效果,还需要相当长的时间。
这个行业需要做好打持久战的准备。技术的成熟和普及不会一蹴而就,需要在技术能力提升、场景深耕、用户体验优化等多个维度持续投入。最终的竞争优势将属于那些能够深度理解业务场景、提供实用工具、坚持长期价值创造的团队。
在这个过程中,开放合作将变得越来越重要。只有通过开源社区的共同努力,积极响应开发者需求,不断沉淀通用能力,才能逐步提升整个生态的竞争力。让更多人能够更聪明地工作,这不仅是技术愿景,更是时代使命。