0.0.0 |
|
---|
#12 in #构造
10KB
形态分析器
这是一个长期项目,目前正在开发中,尚未提供任何公共功能。其最终完成将需要相当长的时间。
形态分析器 计划成为计算有限状态机和变换器的库和命令行工具。其主要应用领域是自然语言形态处理。计算形态学涉及屈折词形的分析和生成,这是帮助计算机理解自然语言所需步骤之一。
本项目的主要目标是重新实现 Foma 有限状态编译器和 C 库的 Rust 版本。Foma 本身是 Xerox 有限状态工具包(Xfst)的扩展开源实现。
当前版本 0.0.0 作为在 crates.io 上托管的一个占位符。一旦 Foma 的重要部分被重新实现并可以测试,版本号将增加到 0.1.0。
对感兴趣读者的参考文献
- Hulden, M. (2009). Foma:有限状态工具包和库. 第12届欧洲计算语言学协会会议论文集:29–32.
- Hulden, M. (2009). 有限状态机构造方法和算法用于音韵和形态学. 哈利波特大学博士论文。
- Beesley, K. R.; Karttunen, L. (2003). 有限状态形态学. CSLI 计算语言学研究,斯坦福大学,加利福尼亚州,2003年。该书有自己的网站。
依赖关系
~5.5MB
~87K SLoC