#layer #safety #higher-order #agents #construct #wrapped #theory

advancedresearch-agent_safety_layers

构建被安全层包裹的智能体

1 个不稳定版本

0.1.0 2020年4月23日

#7#agents 中排名

MIT/Apache

18KB
200

智能体行为安全层

构建被安全层包裹的智能体。

基于“禅宗理性”理论(也称为“高阶功利主义”)。这是对工具理性的一种扩展,包括关于目标的高阶推理。

关于正确性的非正式证明,请参阅 AgentS::decide 中的注释。

设计

此库假设智能体是在具有完美信息的环境中指定的。这样的智能体可以输出动作而不依赖于感知数据。它们内部模型足以做出理性决策。

从为完美信息设计的智能体,可以构建用于非确定性环境的安全层包裹的智能体。这允许智能体在目标或模型不确定时做出理性决策。基本机制是修改模型并比较决策。

AgentZ 是一种假设其模型完美的仅执行动作的智能体。这种智能体仅在具有完美信息的环境中是安全的。

AgentS 是具有核心子智能体的智能体。在非确定性环境中,AgentS 证明比核心更安全。由于它比核心更安全,因此可以用来构建任意安全的智能体,尽管这些智能体不保证有效。

此库不包含智能体和环境之间交互的固定算法。使用此库可以构建许多这样的算法。

"更安全"的定义

智能体使用环境的模型模拟其动作的后果。

当智能体的下一个动作对其模型的修改保持不变时,该智能体是“更安全的”。

例如

  • 目标和子目标的修改
  • 物理状态的修改
  • 其他智能体心理模型理论的修改

当智能体不安全时,假定请求模型更新是安全的。

模型更新包括来自环境的新信息。

模型更新还可以断言目标已正确指定。当对正确目标有更高的信心时,在需要时可以降低安全性级别。

安全性属性

这些智能体不假设是确定性的,这意味着不保证安全行为。

即使 AgentS 证明比其核心更安全,它也只能平均而言更安全,假设开销不会降低安全性。

安全层仅进行深度探测,而不是广度探测。深度意味着智能体的模型是按顺序修改的。为了进行广度探测,必须重复采样动作。

安全层和自然数

在自然数的皮亚诺公理中

  • 自然数集Z为零
  • S是某些自然数的后继

例如:3 = S(S(S(Z)))

当其结构对应于自然数N的皮亚诺表示时,一个智能体具有N个安全层。

内存复杂度

所有安全层使用单个模型。每个安全层添加delta以跟踪突变。

时间复杂度

时间复杂度是线性的 O(N),其中 N 是安全层数。这是因为 AgentS 在第一个参数中使用核心零,而在第二个参数中扩展

1 = 0 0'
2 = 0 1' = 0 0' 0''
3 = 0 2' = 0 0' 1' = 0 0' 0'' 0'''
...

无运行时依赖