#sequence #transformer #neural #sticker #parser #labeler #syntax-dot

废弃 app sticker2-utils

神经序列标注器,被 SyntaxDot 取代

8 个版本

0.5.3 2020年12月18日
0.5.2 2020年10月6日
0.4.2 2020年9月9日
0.4.1 2020年8月12日
0.3.0 2020年5月19日

#11 in #sticker

自定义许可协议

230KB
5.5K SLoC

警告: sticker 已被 SyntaxDot 取代,它支持 许多 新特性

  • 多任务学习。
  • 预训练的转换器模型,如 BERT 和 XLM-R。
  • 除了序列标注外,还包括双线性解析。
  • 词形还原。

sticker

sticker 是一个使用神经网络的序列标注器。

简介

sticker 是一个序列标注器,它使用循环神经网络、转换器或扩张卷积神经网络。原则上,它可以用来执行任何序列标注任务,但到目前为止,重点是

  • 词性标注
  • 拓扑字段标注
  • 依存句法分析
  • 命名实体识别

功能

  • 输入表示
    • finalfusion 嵌入,具有子词单元
    • 双向字节 LSTM
  • 隐藏表示
    • 双向循环神经网络(LSTM 或 GRU)
    • 转换器
    • 扩张卷积
  • 分类层
    • Softmax(最佳-N)
    • CRF
  • 部署
    • libtensorflow 链接的独立二进制文件
    • 非常自由的 许可协议
    • 带有模型的 Docker 容器

状态

sticker 几乎已准备好投入生产,我们正在为 1.0.0 版本做准备。当前版本创建的图表和模型必须与 sticker 1.x.y 兼容。在 1.0.0 发布之前,仍可能发生破坏性 API 或配置文件更改。

下一步是什么

参考文献

sticker 使用以下论文中的技术或受到启发

问题

您可以在sticker问题跟踪器中报告错误和功能请求。

许可证

sticker遵循蓝橡模型许可版本1.0.0。在tf-proto中的Tensorflow协议缓冲区定义遵循Apache许可证版本2.0。贡献者名单也可用

致谢

  • sticker由Daniël de Kok & Tobias Pütz开发。
  • sticker的Python前身由Erik Schill开发。
  • Sebastian Pütz和Patricia Fischer对sticker项目中的大量代码进行了审查。

依赖关系

~21–34MB
~530K SLoC