Agent对Infra的改变：Agent对现有连接基础设施的挑战

AI对连接的特殊要求

基于LLM构建的智能体要想最大限度的发挥能力，对连接方式有特殊的要求：

而当前所有的APP、软件或网站，都是为人类访问而设计的，AI要想访问，必须学习和模仿人类的访问方式。这也促使了Computer use和Browser use技术的诞生。

这两种技术短期是有价值的，但是他们存在着天然的短板，比如，Computer use由于基于屏幕的视觉信息，成本较高且需要占用用户的电脑屏幕；Browser use则只能够访问web网站，并且存在着用户登录时的安全性问题。

为此，我们需要更加AI原生的方式，让AI与数字世界进行交互，让智能体与智能体进行交互。

这也就诞生了另外一条技术路线：Protocol。

使用Protocol处理数据更高效：因为AI更加擅长处理的是最直接的底层数据，而不是屏幕或浏览器。
标准化能够降低连接成本：通过将Protocol标准化，所有支持标准Protocol的软件或智能体，都能够进行互联互通，这能够极大的降低连接成本，形成一个新的生态。
使用协议，可以构建一个AI原生的、便于AI访问的数据网络，独立于当前专为人类设计的、基于屏幕的、基于浏览器的互联网。

我认为这才是MCP最近获得广泛关注的底层原因，它用AI原生的方式，解决了当下最重要的问题：模型如何连接工具与资源。同时标准化的方式又能够降低整个行业的连接成本，形成新的生态。

在OpenAI宣布支持MCP之后，MCP基本上可以看做行业的事实标准，基本不大可能在出现第二个MCP。未来MCP和标准化机构合作，推进MCP标准化应该是大概率事件。

Protocol这条技术路线最大的问题，是需要改造原有的软件，改造成本较高。不过这个成本正在被AI快速的降低：

使用MCP能够构建更加高效的智能体，智能体越来越多之后，他们之间如何进行通信与协作？

MCP是为解决模型连接资源与工具的问题而设计，难以直接用于智能体之间的通信与协作。主要有以下两个核心问题（以智能体A访问智能体B为例）：

身份问题：使用MCP，要求智能体A必须在智能体B有一个注册账号。如果智能体A要访问很多的智能体，这些智能体都属于不同的组织，这要求A必须管理很多的账号，成本非常高。
协议架构：MCP是典型的CS架构，client主动连接server，并且对client和server的角色进行了严格区分。而在智能体网络中，智能体与智能体之间更多的是点对点的关系。CS架构天然不适合智能体的点对点通信，特别是在智能体连接、协作上：单向的CS连接，一方无法找到另一方；双向CS连接可以解决这个问题，不过整体上非常的复杂。

行业中有很多协议专门为解决智能体之间的通信与协作难题而设计，目前在设计和实现上最完备的是ANP（Agent Network Protocol），以及IBM推出的ACP（Agent Communication Protocol）和思科推出的ACP（Agent Connection Protocol）

以ANP为例，重点解决的是智能体在互联网上的协作问题，比如智能体身份、智能体描述、智能体发现等问题。其最大的特点是用W3C DID（去中心化身份）来标识智能体，是智能体能够使用自己的身份ID，与任意其他的智能体进行交互。同时ANP的协议架构是P2P架构，天然适合智能体与智能体之间的点对点通信。

随着互联网中的智能体越来越多，智能体之间的连接越来越多，必然会对现有的互联网造成深刻的改变。对互联网的演进，我们有几点判断：