2个版本

0.1.1 2021年5月6日
0.1.0 2021年5月5日

#495 in 文本编辑器


3 crates中使用

MIT/Apache

155KB
3.5K SLoC

Layered NLP

在抽象标记上增量构建识别器,这些标记组合起来可以创建多个可能的解释。

主要功能

  • 抽象标记类型以支持像Storyscript中那样的“丰富”标记。
  • 可能会生成相同标记跨度多个解释。
  • 为输入标记列表生成具有不同属性的多个范围,例如

分层

这里的关键思想是允许从一些模糊的标记开始,并通过逐渐添加构建在自身之上的信息来逐步构建意义。

简化:Money = '$' + Number

    $   123   .     00
                    ╰Natural
              ╰Punct
        ╰Natural
        ╰Amt(Decimal)
    ╰Money($/£, Num)─╯

简化

  • 位置(纽约市) = '' + '泽西' + ''
  • 位置(AMS) = '阿姆斯特丹'
  • 地址(,位置) =+动词('生活') +谓词('') +位置
    I     live      in      New York City
                                     ╰Noun
                                ╰Noun
                            ╰Adj
                    ╰Predicate
          ╰Verb
    ╰Noun
    ╰Person(Self)
                            ╰──Location─╯
    ╰────Address(Person, Location)─────╯

MIT licensed APACHE licensed

依赖关系

~3–4MB
~63K SLoC