1个不稳定版本

使用旧的Rust 2015

0.1.0 2016年9月25日

#21 in #regex-parser

AGPL-3.0

265KB
646

acetylene-parser

不同化学命名法的字符串解析器。

函数

  • tokenize(字符串, 类型="公式") ->物质

    将描述化学物质的字符串进行分词,生成一个包含(可选)官能团与(更)基本成分相对应的物质。

    • "formula"类型期望一个简单的"中学"元素符号命名字符串。

    • "smiles"期望使用SMILES系统的化学名称。

    • 待办事项:"iupac"期望使用IUPAC系统的化学名称。

路线图

  • 实现SMILES解析
  • 根据SMILES的发现改进结构
  • 决定InChI实现是否值得

参考文献

SMILES

IUPAC

InChI

数据

依赖项

~3.5MB
~75K SLoC