Skip to content

ANP 的核心概念和交互模式

1. 核心概念

本规范定义了智能体描述的两个核心概念:Information 和 Interface。这两个概念为智能体对外公开信息提供了标准化的框架,确保智能体之间能够有效地发现、理解和交互。

1.1 Information(信息)

Information 表示智能体向外部实体提供的数据资源。这些资源可以是结构化或非结构化的数据,用于描述智能体的能力、状态、产品或服务。

Information 资源包括但不限于以下类型:

  • 结构化数据:JSON文档、XML文件、数据库查询结果
  • 媒体资源:图像、视频、音频文件及其相关元数据
  • 描述性文档:产品规格、服务说明、使用指南
  • 状态信息:智能体当前状态、可用性信息、配置参数

Information 具有以下关键特征:

  • 可描述性:每个 Information 资源都必须包含充分的元数据,使其他智能体能够理解资源的类型、用途和访问方式
  • 可发现性:Information 资源通过统一的描述机制向外部实体公开,支持自动化的发现和索引过程

1.2 Interface(接口)

Interface 定义了智能体与外部实体进行动态交互的标准化入口点。Interface 提供了智能体功能的可调用表示,允许其他智能体或系统与之进行程序化交互。

Interface 分为以下两个主要类别:

1.2.1 自然语言接口 (Natural Language Interface)

自然语言接口为智能体提供了基于人类语言的交互能力。这类接口允许使用自然语言查询和命令来访问智能体的功能。

自然语言接口的特征包括:

  • 语言灵活性:支持多种自然语言表达方式,能够理解语义变化和上下文信息
  • 个性化交互:能够根据交互历史和用户偏好提供定制化的响应
  • 开放式任务处理:适用于需要创造性思维或复杂推理的任务场景
  • 通用性:建议所有兼容规范的智能体都应实现至少一个自然语言接口,以确保基本的互操作性

1.2.2 结构化接口 (Structured Interface)

结构化接口提供了基于预定义协议和数据格式的程序化交互方式。这类接口遵循标准化的API设计原则,确保可预测性和高效性。

结构化接口的特征包括:

  • 协议标准化:支持广泛采用的协议标准,如OpenAPI、JSON-RPC、GraphQL、WebRTC等
  • 类型安全性:通过明确的数据类型定义和验证机制确保交互的正确性
  • 性能优化:相比自然语言接口,结构化接口通常具有更低的延迟和更高的吞吐量
  • 功能专门化:每个结构化接口可以针对特定的功能域进行优化

1.3 接口选择与优先级

实现协议的智能体在选择交互接口时,应遵循以下优先级和选择策略:

  1. 结构化接口优先原则:当存在满足功能需求的结构化接口时,应优先选择该接口进行交互,以获得最佳的性能和可靠性
  2. 功能完整性评估:在选择接口之前,必须评估目标接口是否能够完全满足当前任务的功能需求
  3. 回退机制:当结构化接口无法满足复杂或非标准化需求时,可以回退到自然语言接口
  4. 上下文感知选择:接口选择应考虑任务的复杂度、实时性要求、以及所需的个性化程度

2. 交互模式

协议采用基于链接数据的交互模式,该模式允许智能体通过统一资源定位符(URL)将其Information和Interface组织为一个可导航的数据网络。这种方法类似于万维网的超链接结构,使得智能体能够将其公开数据构建成一个数据网络,所有的数据网络可以连接成一个便于AI访问的数据网络。

2.1 网络化数据组织

交互模式的核心原理基于以下架构设计:

2.1.1 URL链接网络

智能体必须使用URL作为统一的寻址机制来组织其Information和Interface资源。每个URL指向一个特定的资源或接口定义,形成一个可遍历的链接图。这种设计确保了:

  • 全局唯一性:每个资源都有唯一的网络地址
  • 可解引用性:URL可以直接用于访问相应的资源
  • 链接完整性:资源之间的关系通过URL链接明确表达

2.1.2 入口点机制

建议每个智能体都提供一个主要的入口点,通常表现为智能体描述文档(Agent Description Document)。该文档的作用类似于网站的首页,包含:

  • 智能体的基本元数据和标识信息
  • 所有可用Information资源的链接和描述
  • 所有可用Interface的链接和规范引用
  • 必要的访问控制和安全策略信息

2.2 交互过程

智能体间的交互过程类似Web爬虫的工作方式,从一个入口点开始进行递归导航。客户端智能体首先获取目标智能体的描述文档URL,通过HTTP请求获取该文档后,解析其中包含的Information资源链接和Interface定义链接。基于任务需求,客户端智能体选择性地访问相关的URL链接,如果获取的资源中包含进一步的链接,则继续递归获取,直到收集到完成任务所需的充分信息。

在获取信息的同时,客户端智能体在本地环境中整合这些数据,制定执行策略并选择合适的Interface进行调用。整个过程强调本地决策处理,敏感信息不会传递给第三方,而是在客户端本地进行分析和处理。最终,客户端智能体通过发现的Interface执行具体操作,处理返回结果并完成任务。这种模式既保证了隐私安全,又实现了灵活的按需信息获取。

2.3 交互模式的架构优势

2.3.1 与现有Web基础设施的兼容性

充分利用了现有的Web技术栈和基础设施:

  • 协议重用:基于HTTP/HTTPS协议,兼容现有的网络设备和中间件
  • 缓存机制:支持标准的Web缓存策略,提高性能和可扩展性
  • 搜索引擎友好:Information资源可被传统搜索引擎索引,增强了智能体的可发现性

2.3.2 隐私保护和数据主权

本地决策模式提供了重要的隐私保护优势:

  • 数据本地化:敏感信息在本地处理,减少了数据泄露的风险
  • 选择性共享:客户端智能体可以精确控制与其他智能体共享的信息范围