智能体互联网(Agentic Web)有什么不同
智能体基本上已经成为AI行业的共识,如果说有分歧,大概率也是对落地的时间有分歧。当下行业主要关注的还是智能体本身如何构建,对于智能体之间如何协作、智能体网络的特征,研究的不是很多。
在这篇文章中,我们尝试从互联网演进的本质:释放新技术的能力,来探讨智能体互联网(Agentic Web)与现有互联网的不同。
我们认为智能体除了对软件本身有大的改变外,智能体对互联网也会带来深刻的改变。
以现有全球互联网市场规模来看,智能体互联网有什么不同之处,至少是一个千亿美金问题。
本文要点:
- 互联网演进方向的最本质问题,是如何最大限度地释放新技术的能力。下一代互联网肯定会因为AI技术的发展,而作出深刻的改变。
- 要释放AI的能力,需要让AI能够获得完整的上下文信息,能够调用互联网上的所有工具,能够让AI用它最擅长的方式与互联网交互,能够让AI高效地与互联网上的其他AI协作。
- 为此,我们需要解决三个问题:互联互通、原生接口、高效协作。
- API或通信协议是AI与互联网交互的最佳方式。我们不看好Computer Use技术,因为它是让AI模仿人;AI手机提供了一个在终端打通各个APP的方案;Anthropic的MCP是最符合我们设想的技术。
- 个人助理会成为下一代互联网的新入口,智能体渗透到互联网的各个角落,智能体可以互联互通,它们可以自组织、自协商,构建一个高效协作网络。
- 我们正在开发一个用于智能体通信的开源协议:AgentNetworkProtocol(ANP),目标是成为智能体互联网时代的HTTP。
决定互联网演进方向的本质问题是什么
我们认为,推动互联网演进的最本质问题,或者最底层的推动力,是如何释放新技术的能力。
我们分析一个问题,为什么PC互联网时代产品以web为主,而移动互联网时代却是以APP为主?
PC互联网时期,新技术以网络通信技术(TCP/IP、DNS、HTTP)、Web技术(HTML、CSS、JavaScript)、数据库技术、信息搜索等技术为主。以浏览器和Web技术为媒介的产品形态,释放了开放互联网的访问能力,让信息可以通过统一入口被广泛获取。
再加上当时的技术条件(有限的带宽和硬件性能),以及web技术跨平台特性,决定了Web是最适合PC互联网的产品形态。
而到了移动互联时期,新出现的技术包括移动设备与硬件(加速计、陀螺仪、GPS、触摸屏、摄像头、芯片)、移动网络(3G、4G、5G)、移动操作系统(iOS、Android)等。
APP相对于web技术,能够通过操作系统的API深度整合硬件能力,针对设备性能优化运行效率,能够持续在线并且实时互动。
正是这些因素,新的技术能力才通过APP释放出来,APP的体验也远超web,让APP也成为了移动互联网时代的主流产品形态。
在当下以及未来10年,新技术无疑是以生成式人工智能、大语言模型、智能体为代表的AI技术。如何释放AI的能力,决定了未来互联网的演进方向。
下一代互联网应如何释放AI的能力
当前的互联网基础设施已经相当的完善,但是面对AI的特性,要充分释放AI的能力,还面临一些挑战。
如何让AI获得完整的上下文信息,如何让AI调用所有的工具能力
AI只有获得完整的上下文信息,才能做出正确的决策。只有能够调用所有的工具能力,才能高效的完成复杂任务。
但是当前的互联网本质上由一个个的信息孤岛组成,孤岛之间信息流动困难。
在之前,人类其实扮演了信息孤岛的缝合怪的角色,通过浏览器、APP、搜索引擎、社交网络等,将这些信息孤岛连接起来。未来,这将由AI更加高效的完成。
当前已经有技术方案在尝试解决这些问题,典型的比如AI手机、Computer Use技术,让AI利用图形界面、浏览器或者APP终端接口,来打通AI与互联网的连接。但我们认为,这些都不是最高效的方案。
如何让AI用它最擅长的方式接入互联网
点评一下当下AI接入互联网的方案。
- Computer Use技术
很多模型厂商都推出了类似的方案。
但我一向不看好这个技术。这个技术出现的原因是,原有的互联网产品是为人类使用而设计,在这些产品面向AI重构之前,让AI学习、模仿人类,确实是AI接入互联网的最快途径。但不是最高效的路径。短期和中期可能有价值,长期价值不大。
- AI手机方案
比如apple intelligence,国内很多手机厂商也在大力推广。
这类技术的特点是,在终端上,通过APP客户端开放的接口,打通互联网的数据与能力。让AI能够获得多个APP的数据,调用多个APP的能力。
这个技术比Computer Use技术更进一步,AI天生擅长处理底层数据,而非图形界面。但是在这个方案中,终端上的APP定位非常的尴尬,和AI手机是处于既竞争又合作的状态,既想获得AI手机带来的流量,又不想开放太多数据以被AI手机替代。
- Claude MCP
这是当下最符合我们设想的方案。
我们认为,AI不同于人类,它更擅长处理底层数据而非图形界面。AI应该用它最擅长的方式(API或通信协议),与互联网交互。
我们也很早就在做类似的项目和研究:Agent Network Protocol技术白皮书。
我们与MCP最大的区别在于世界观的差异:
- MCP是以模型为核心,整个互联网都是他的上下文与工具;
- 我们(Agent Network Protocol)以智能体为核心,每个智能体具有同等的地位,组成一个去中心化的智能体协作网络。
如何让AI高效的与互联网上的其他AI协作
传统的网络节点,往往通过硬编码或人工的方式来进行连接。有了AI之后,网络的连接、协作方式也许可以更加的高效。
比如,两个AI节点可以利用自然语言的生成与理解能力,先使用自然语言沟通双方的能力与接口,然后使用标准协议或共识协议进行通信与协作。
这将有助于构建一个更加高效、更低成本的协作网络。
最后再总结一下,互联网要想充分的释放AI的能力,还需要解决以下三个问题:
- 🌐 互联互通:让所有的智能体相互之间都能够进行通信,打破数据孤岛,让AI能够获得完整的上下文信息,能够调用互联网上的所有工具。
- 🖥️ 原生接口:AI无需模仿人类访问互联网,AI应该用它最擅长的方式(API或通信协议)与互联网交互。
- 🤝 高效协作:利用AI,智能体之间可以自组织、自协商,构建比现有互联网更低成本、更高效率的协作网络。
智能体互联网(Agentic Web)是什么样的
关于智能体互联网的定义,是个比较大的命题,我们给不了学术上的严谨定义。但是我们可以从通俗的角度阐述下我们对它的理解。这也算是盲人摸象,给出我们“摸到”的部分。
- 智能体成为新入口
PC互联网是人用PC上网;移动互联网是人使用移动终端上网;智能体互联网,则是智能体代替人上网,代替人与数字世界交互。
这个入口未来大概率是一个特殊的智能体:超级个人助理。它代替人类上网,并且在客户端通过个性化的UI与人类交互。在后端通过API或协议,与其他的智能体进行交互。
- 智能体渗透到互联网的各个角落
除了个人助理,我们认为互联网还有很多不直接与最终用户交互的智能体,比如酒店、餐厅、银行、学校等智能体。他们通过与个人助理的交互,间接的为人提供服务。
- 智能体可以互联互通
无论是个人助理,还是背后提供服务的智能体,无论他们属于哪个公司,哪个平台,他们都可以互联互通。
- 一个更加扁平的网络
如果智能体能够代表一个人或一个实体作为互联网中的一个节点互相连接协作,那中心化平台(比如微信、淘宝)的作用会降低。未来的互联网会更加的扁平化、去中心化。
- 自组织自协商的高效协作网络
智能体之间可以自组织、自协商,构建一个高效协作网络。
总结
归根到底,我们认为是技术的发展推动了互联网的演进,如何释放新技术的能力,决定了互联网的演进方向。
智能体互联网会不会出现,我们现在还不确定,但是我们可以确定的是,未来互联网肯定会因为AI技术的发展而深刻的改变。
联系我们
我们不是空想家。
我们正在根据我们的设想,开发一个用于智能体通信的开源标准协议:AgentNetworkProtocol(ANP),项目地址:https://github.com/agent-network-protocol/AgentNetworkProtocol。
AgentNetworkProtocol的目标是成为智能体互联网时代的HTTP。我们的愿景是定义智能体之间的连接方式,为数十亿智能体构建一个开放、安全、高效的协作网络。
如果你也对智能体通信协议或智能体互联网感兴趣,欢迎联系我们。我们最近正在和国内外的AI从业者分享交流:
- 微信:flow10240
- 邮箱:chgaowei@gmail.com
最后,我始终认为,如果不考虑扩展性,web3真的是最适合AI的互联网形态。如果你在做web3+AI,也欢迎和我们交流。
版权声明
Copyright (c) 2024 GaoWei Chang
本文件依据 MIT 许可证 发布,您可以自由使用和修改,但必须保留本版权声明。