3 个版本
使用旧的 Rust 2015
0.1.2 | 2018年8月2日 |
---|---|
0.1.1 | 2018年8月2日 |
0.1.0 | 2018年8月2日 |
#1509 在 文本处理
42 每月下载
13KB
140 行
片假名/ASCII 转换工具
将日本片假名、平假名和ASCII字符转换为全角(半角)或半角(全角)的转换工具。
关于存储数据、报告、用户展示等方面,有许多关于日本文字和ASCII字符的要求。许多服务要求数据以特定格式发送(例如,某些金融服务要求所有片假名都以半角单字节(半角)字符发送,而汉字和ASCII则以全角双字节(全角)字符发送)。在其他用例中,数据以所有双字节(全角)字符存储,等待由其他工具按需转换。此库旨在帮助进行这些转换,使存储和发送日本字符变得更容易。
术语
由于用于表示日本字符的术语很多,可能会令人困惑,因此提供此列表以澄清定义
术语 | 描述 |
---|---|
半角片假名 | 用单字节表示的片假名字符 |
全角片假名 | 用两个字节表示的片假名字符 |
单字节 | 值存储在一个字节的字符(半角片假名,普通ASCII) |
双字节 | 值存储在两个字节的字符(全角片假名,平假名,汉字,双字节ASCII) |
半角(半角) | 日本术语“半角”。与“单字节”的定义相同。 |
全角(全角) | 日本术语“全角”。与“双字节”的定义相同。 |
片假名(カタカナ) | 可以存储在单字节(半角)或双字节(全角)中的日本片假名字符集 |
平假名(ひらがな) | 只能以双字节值存储的日本平假名字符集 |
汉字(漢字) | 只能以双字节值存储的日本汉字字符 |
罗马字(ローマ字) | 字面意思是“罗马字母”,用于用拉丁字母格式(使用ASCII字符)表示日本单词的字符集。 |
ASCII | 标准的ASCII字符集,通常存储在一个字节中,但也有用于日本“罗马字”表示的双字节版本 |
用法
只需将其添加到您的 Cargo.toml
[dependencies]
kana-conversion = "0.1"
并在您的 Rust 代码中使用
extern crate kana_conversion;
use kana_conversion::to_double_byte;
转换函数
"to_double_byte" 函数接受一个要转换的字符串切片和一个模式。如果选择 AsciiOnly
,则只有正常ASCII字符将被转换为双字节(全角),如果选择 KanaOnly
,则只有半角(半角)片假名将被转换,而 KanaAndAscii
将转换两者。
返回值是一个拥有双字节(全角)字符的String,根据指定的模式
进行转换。
许可证
许可协议
贡献
欢迎贡献,并将受到上述许可证规定的规范约束。
依赖项
~10KB