#kana #full-width #japanese #half-width #byte-conversion

kana-converter

用于半角/全角日本语言字符(片假名、平假名和ASCII)的简单转换器

3 个版本

使用旧的 Rust 2015

0.1.2 2018年8月2日
0.1.1 2018年8月2日
0.1.0 2018年8月2日

#1509文本处理

42 每月下载

MIT 许可证

13KB
140

片假名/ASCII 转换工具

将日本片假名、平假名和ASCII字符转换为全角(半角)或半角(全角)的转换工具。

关于存储数据、报告、用户展示等方面,有许多关于日本文字和ASCII字符的要求。许多服务要求数据以特定格式发送(例如,某些金融服务要求所有片假名都以半角单字节(半角)字符发送,而汉字和ASCII则以全角双字节(全角)字符发送)。在其他用例中,数据以所有双字节(全角)字符存储,等待由其他工具按需转换。此库旨在帮助进行这些转换,使存储和发送日本字符变得更容易。

术语

由于用于表示日本字符的术语很多,可能会令人困惑,因此提供此列表以澄清定义

术语 描述
半角片假名 用单字节表示的片假名字符
全角片假名 用两个字节表示的片假名字符
单字节 值存储在一个字节的字符(半角片假名,普通ASCII)
双字节 值存储在两个字节的字符(全角片假名,平假名,汉字,双字节ASCII)
半角(半角) 日本术语“半角”。与“单字节”的定义相同。
全角(全角) 日本术语“全角”。与“双字节”的定义相同。
片假名(カタカナ) 可以存储在单字节(半角)或双字节(全角)中的日本片假名字符集
平假名(ひらがな) 只能以双字节值存储的日本平假名字符集
汉字(漢字) 只能以双字节值存储的日本汉字字符
罗马字(ローマ字) 字面意思是“罗马字母”,用于用拉丁字母格式(使用ASCII字符)表示日本单词的字符集。
ASCII 标准的ASCII字符集,通常存储在一个字节中,但也有用于日本“罗马字”表示的双字节版本

用法

只需将其添加到您的 Cargo.toml

[dependencies]
kana-conversion = "0.1"

并在您的 Rust 代码中使用

extern crate kana_conversion;

use kana_conversion::to_double_byte;

转换函数

"to_double_byte" 函数接受一个要转换的字符串切片和一个模式。如果选择 AsciiOnly,则只有正常ASCII字符将被转换为双字节(全角),如果选择 KanaOnly,则只有半角(半角)片假名将被转换,而 KanaAndAscii 将转换两者。

返回值是一个拥有双字节(全角)字符的String,根据指定的模式进行转换。

许可证

许可协议

贡献

欢迎贡献,并将受到上述许可证规定的规范约束。

依赖项

~10KB