1 个不稳定版本
0.1.0 | 2020年4月23日 |
---|
#7 在 #agents 中排名
18KB
200 行
智能体行为安全层
构建被安全层包裹的智能体。
基于“禅宗理性”理论(也称为“高阶功利主义”)。这是对工具理性的一种扩展,包括关于目标的高阶推理。
关于正确性的非正式证明,请参阅 AgentS::decide
中的注释。
设计
此库假设智能体是在具有完美信息的环境中指定的。这样的智能体可以输出动作而不依赖于感知数据。它们内部模型足以做出理性决策。
从为完美信息设计的智能体,可以构建用于非确定性环境的安全层包裹的智能体。这允许智能体在目标或模型不确定时做出理性决策。基本机制是修改模型并比较决策。
AgentZ
是一种假设其模型完美的仅执行动作的智能体。这种智能体仅在具有完美信息的环境中是安全的。
AgentS
是具有核心子智能体的智能体。在非确定性环境中,AgentS
证明比核心更安全。由于它比核心更安全,因此可以用来构建任意安全的智能体,尽管这些智能体不保证有效。
此库不包含智能体和环境之间交互的固定算法。使用此库可以构建许多这样的算法。
"更安全"的定义
智能体使用环境的模型模拟其动作的后果。
当智能体的下一个动作对其模型的修改保持不变时,该智能体是“更安全的”。
例如
- 目标和子目标的修改
- 物理状态的修改
- 其他智能体心理模型理论的修改
当智能体不安全时,假定请求模型更新是安全的。
模型更新包括来自环境的新信息。
模型更新还可以断言目标已正确指定。当对正确目标有更高的信心时,在需要时可以降低安全性级别。
安全性属性
这些智能体不假设是确定性的,这意味着不保证安全行为。
即使 AgentS
证明比其核心更安全,它也只能平均而言更安全,假设开销不会降低安全性。
安全层仅进行深度探测,而不是广度探测。深度意味着智能体的模型是按顺序修改的。为了进行广度探测,必须重复采样动作。
安全层和自然数
在自然数的皮亚诺公理中
- 自然数集Z为零
- S是某些自然数的后继
例如:3 = S(S(S(Z)))
当其结构对应于自然数N的皮亚诺表示时,一个智能体具有N个安全层。
内存复杂度
所有安全层使用单个模型。每个安全层添加delta以跟踪突变。
时间复杂度
时间复杂度是线性的 O(N)
,其中 N
是安全层数。这是因为 AgentS
在第一个参数中使用核心零,而在第二个参数中扩展
1 = 0 0'
2 = 0 1' = 0 0' 0''
3 = 0 2' = 0 0' 1' = 0 0' 0'' 0'''
...