1个不稳定版本
使用旧的Rust 2015
0.1.0 | 2016年9月25日 |
---|
#21 in #regex-parser
265KB
646 行
acetylene-parser
不同化学命名法的字符串解析器。
函数
-
tokenize(字符串, 类型="公式") ->物质
将描述化学物质的字符串进行分词,生成一个包含(可选)官能团与(更)基本成分相对应的物质。
路线图
- 实现SMILES解析
- 根据SMILES的发现改进结构
- 决定InChI实现是否值得
参考文献
SMILES
- https://en.wikipedia.org/wiki/Simplified_molecular-input_line-entry_system
- http://opensmiles.org/opensmiles.html
- http://www.dalkescientific.com/writings/diary/archive/2004/01/05/tokens.html
IUPAC
- http://www.chem.uiuc.edu/GenChemReferences/nomenclature_rules.html
- https://web.archive.org/web/20100626004648/http://www.acdlabs.co.uk/iupac/nomenclature/93/r93_125.htm
- https://en.wikipedia.org/wiki/IUPAC_nomenclature_of_organic_chemistry
- https://bitbucket.org/dan2097/opsin/src
InChI
数据
依赖项
~3.5MB
~75K SLoC