Agent对Infra的改变:Agent对现有连接基础设施的挑战
AI对连接的特殊要求
基于LLM构建的智能体要想最大限度的发挥能力,对连接方式有特殊的要求:
- AI必须能够访问到所有的信息,才能够为人或组织作出更加智能的决策,这要求AI与所有的信息是互联互通的。
- AI必须能够调用所有的工具,才能够帮助人或组织更好的完成任务,这要求AI与所有工具是互联互通的。
而当前所有的APP、软件或网站,都是为人类访问而设计的,AI要想访问,必须学习和模仿人类的访问方式。这也促使了Computer use和Browser use技术的诞生。
这两种技术短期是有价值的,但是他们存在着天然的短板,比如,Computer use由于基于屏幕的视觉信息,成本较高且需要占用用户的电脑屏幕;Browser use则只能够访问web网站,并且存在着用户登录时的安全性问题。
为此,我们需要更加AI原生的方式,让AI与数字世界进行交互,让智能体与智能体进行交互。
Protocol:AI原生的连接与协作方式
这也就诞生了另外一条技术路线:Protocol。
使用Protocol处理数据更高效:因为AI更加擅长处理的是最直接的底层数据,而不是屏幕或浏览器。
标准化能够降低连接成本:通过将Protocol标准化,所有支持标准Protocol的软件或智能体,都能够进行互联互通,这能够极大的降低连接成本,形成一个新的生态。
使用协议,可以构建一个AI原生的、便于AI访问的数据网络,独立于当前专为人类设计的、基于屏幕的、基于浏览器的互联网。
我认为这才是MCP最近获得广泛关注的底层原因,它用AI原生的方式,解决了当下最重要的问题:模型如何连接工具与资源。同时标准化的方式又能够降低整个行业的连接成本,形成新的生态。
在OpenAI宣布支持MCP之后,MCP基本上可以看做行业的事实标准,基本不大可能在出现第二个MCP。未来MCP和标准化机构合作,推进MCP标准化应该是大概率事件。
Protocol这条技术路线最大的问题,是需要改造原有的软件,改造成本较高。不过这个成本正在被AI快速的降低:
- AI改变了软件开发的方式,通过AI生成代码,可以大幅度降低软件开发的成本。
- AI改变了软件运行的方式,使用LLM驱动软件运行,可以将软件的本质复杂度在LLM内解决,不在需要大量复杂代码。
- AI改变了软件连接的方式,通过LLM构造请求并处理响应,可以大幅度降低软件对接、联调的成本。
MCP的下一步:智能体通信与协作
使用MCP能够构建更加高效的智能体,智能体越来越多之后,他们之间如何进行通信与协作?
MCP是为解决模型连接资源与工具的问题而设计,难以直接用于智能体之间的通信与协作。主要有以下两个核心问题(以智能体A访问智能体B为例):
- 身份问题:使用MCP,要求智能体A必须在智能体B有一个注册账号。如果智能体A要访问很多的智能体,这些智能体都属于不同的组织,这要求A必须管理很多的账号,成本非常高。
- 协议架构:MCP是典型的CS架构,client主动连接server,并且对client和server的角色进行了严格区分。而在智能体网络中,智能体与智能体之间更多的是点对点的关系。CS架构天然不适合智能体的点对点通信,特别是在智能体连接、协作上:单向的CS连接,一方无法找到另一方;双向CS连接可以解决这个问题,不过整体上非常的复杂。
行业中有很多协议专门为解决智能体之间的通信与协作难题而设计,目前在设计和实现上最完备的是ANP(Agent Network Protocol),以及IBM推出的ACP(Agent Communication Protocol)和思科推出的ACP(Agent Connection Protocol)
以ANP为例,重点解决的是智能体在互联网上的协作问题,比如智能体身份、智能体描述、智能体发现等问题。其最大的特点是用W3C DID(去中心化身份)来标识智能体,是智能体能够使用自己的身份ID,与任意其他的智能体进行交互。同时ANP的协议架构是P2P架构,天然适合智能体与智能体之间的点对点通信。
互联网的下一步:智能体互联网
随着互联网中的智能体越来越多,智能体之间的连接越来越多,必然会对现有的互联网造成深刻的改变。对互联网的演进,我们有几点判断:
- 个人助手成为新的互联网入口,人通过个人助手访问互联网
- 企业也会使用智能体替代企业软件,并且直接将智能体部署到互联网上服务消费者。
- 个人助手和企业的智能体直接通过协议连接成为可能,而不是通过互联网平台进行连接。消费互联网将会和产业互联网深度融合。
- 智能体之间的连接将成为互联网主要的连接方式,将会出现一个专门面向AI设计、方便AI访问的智能体数据网络。
- 智能体通信协议成为新的基础设施,未来会出现标准化的智能体通信协议。