#sequence #transformer #neural #learning #bert #named #syntax-dot

已弃用 sticker2

神经网络序列标注器,已被SyntaxDot取代

6个版本

0.5.1 2020年12月18日
0.5.0 2020年10月1日
0.4.2 2020年9月9日
0.4.1 2020年8月12日
0.3.0 2020年5月19日

#17 in #bert

39 每月下载量
用于 sticker2-utils

自定义许可证

135KB
3K SLoC

警告: sticker已被SyntaxDot取代,支持许多新特性

  • 多任务学习。
  • 预训练的转换器模型,如BERT和XLM-R。
  • 除了序列标注之外,还有双线性句法分析。
  • 词形还原。

sticker

sticker是一个使用神经网络的序列标注器。

介绍

sticker是一个序列标注器,它使用循环神经网络、转换器或扩张卷积神经网络。原则上,它可以用于执行任何序列标注任务,但到目前为止,重点一直集中在

  • 词性标注
  • 拓扑字段标注
  • 依存句法分析
  • 命名实体识别

特性

  • 输入表示
  • 隐藏表示
    • 双向循环神经网络(LSTM或GRU)
    • 转换器
    • 扩张卷积
  • 分类层
    • Softmax(最佳N)
    • CRF
  • 部署
    • libtensorflow链接的独立二进制文件
    • 非常自由的许可证
    • 带有模型的Docker容器

状态

sticker几乎已准备好投入生产,我们正在准备发布1.0.0版本。使用当前版本创建的图和模型必须与sticker 1.x.y兼容。在发布1.0.0之前,API或配置文件可能还会发生破坏性更改。

下一步该做什么

参考文献

sticker使用了以下论文中的技术或受到了启发

问题

您可以在 sticker 问题跟踪器 中报告错误和功能请求。

许可证

sticker 在 Blue Oak Model License 版本 1.0.0 下许可。位于 tf-proto 的 Tensorflow 协议缓冲区定义在 Apache License 版本 2.0 下许可。贡献者名单也可用 此处

致谢

  • sticker 由 Daniël de Kok 和 Tobias Pütz 开发。
  • sticker 的 Python 前身由 Erik Schill 开发。
  • Sebastian Pütz 和 Patricia Fischer 对 sticker 项目中的大量代码进行了审查。

依赖项

~21MB
~391K SLoC