0.1.0	2020年4月23日

#7 在 #agents 中排名

MIT/Apache

18KB
200 行

智能体行为安全层

构建被安全层包裹的智能体。

基于“禅宗理性”理论（也称为“高阶功利主义”）。这是对工具理性的一种扩展，包括关于目标的高阶推理。

关于正确性的非正式证明，请参阅 AgentS::decide 中的注释。

此库假设智能体是在具有完美信息的环境中指定的。这样的智能体可以输出动作而不依赖于感知数据。它们内部模型足以做出理性决策。

从为完美信息设计的智能体，可以构建用于非确定性环境的安全层包裹的智能体。这允许智能体在目标或模型不确定时做出理性决策。基本机制是修改模型并比较决策。

AgentZ 是一种假设其模型完美的仅执行动作的智能体。这种智能体仅在具有完美信息的环境中是安全的。

AgentS 是具有核心子智能体的智能体。在非确定性环境中，AgentS 证明比核心更安全。由于它比核心更安全，因此可以用来构建任意安全的智能体，尽管这些智能体不保证有效。

此库不包含智能体和环境之间交互的固定算法。使用此库可以构建许多这样的算法。

智能体使用环境的模型模拟其动作的后果。

当智能体的下一个动作对其模型的修改保持不变时，该智能体是“更安全的”。

例如

当智能体不安全时，假定请求模型更新是安全的。

模型更新包括来自环境的新信息。

模型更新还可以断言目标已正确指定。当对正确目标有更高的信心时，在需要时可以降低安全性级别。

这些智能体不假设是确定性的，这意味着不保证安全行为。

即使 AgentS 证明比其核心更安全，它也只能平均而言更安全，假设开销不会降低安全性。

安全层仅进行深度探测，而不是广度探测。深度意味着智能体的模型是按顺序修改的。为了进行广度探测，必须重复采样动作。

在自然数的皮亚诺公理中

例如：3 = S(S(S(Z)))

当其结构对应于自然数N的皮亚诺表示时，一个智能体具有N个安全层。

所有安全层使用单个模型。每个安全层添加delta以跟踪突变。

时间复杂度是线性的 O(N)，其中 N 是安全层数。这是因为 AgentS 在第一个参数中使用核心零，而在第二个参数中扩展

1 = 0 0' 2 = 0 1' = 0 0' 0'' 3 = 0 2' = 0 0' 1' = 0 0' 0'' 0''' ...

无运行时依赖