3个版本 (重大更新)
0.3.0 | 2024年4月18日 |
---|---|
0.2.0 | 2023年10月14日 |
0.1.0 | 2023年9月8日 |
#244 in 数据库实现
在 3 个crate中使用 (通过 izihawa-tantivy)
7KB
117 行
#Tokenizer-API
用于将分词器与tantivy接口的API。
为了不破坏现有分词器的支持,API将保持稳定。
lib.rs
:
分词器负责将文本切割成用于索引的标记流。这是一个独立的crate,因此实现者不需要为每个新的tantivy版本进行更新。
依赖项
~0.4–1MB
~22K SLoC