#lexer #tokenization #token #streaming #streaming-parser #parser #format

text-scanner

一个以UTF-8字符为对象的、零拷贝的文本和代码扫描库

3个版本

0.0.3 2023年7月1日
0.0.2 2023年6月23日
0.0.1 2023年6月16日

#1252 in 文本处理


4个crate中使用了(通过any-lexer

Zlib许可证

195KB
3K SLoC

text-scanner

CI Latest Version Docs License

注意: 此库是实验性的,可能在0.0.*版本中发生重大变化。

一个以UTF-8字符为对象的、零拷贝的文本和代码扫描库。

此crate实现了一个基于UTF-8 char的文本Scanner,它包括用于扫描字符串切片的各种方法,以及回溯功能,可用于实现用于分词文本或代码的词法分析器。

已经实现了对现有语言和格式的扫描扩展,例如对RustCPythonCSSSCSSJSONJSON with Comments等等

有关使用Scanner实现的词法分析器的示例,请参阅any-lexer crate,该crate实现了例如RustCPythonCSSSCSSJSONJSON with Comments等等的词法分析器。

依赖关系