3个版本 (破坏性)
0.3.0 | 2023年10月8日 |
---|---|
0.2.0 | 2023年3月26日 |
0.1.0 | 2023年3月26日 |
#75 在 #chinese
2.5MB
268 行
TOCFL
《台湾华语文能力测验》(TOCFL)(中文:華語文能力測驗; 拼音:Huáyǔwén Nénglì Cèyàn)是对非母语者,包括外国学生的台湾普通话水平的标准化测试。虽然网上有很多词汇表,但其中很多要么是不完整/过时的,要么是付费墙后。
此仓库提供的数据集基于(来自官方TOCFL网站链接)
coct.naer.edu.tw/download/tech_report
词汇
台湾华语文能力基准词汇表_111-11-14.xlsx
这个词汇表很好,它给出了书面和口语的频率。它还提供了拼音以区分不同意义的相同字符的发音。
字符
台湾华语文能力基准汉字列表_111-09-20.xlsx
其他
https://github.com/tomcumming/tocfl-word-list 也提供了TOCFL列表,但似乎是不完整(或过时的)。编制列表所使用的来源并不完全清楚。
依赖项
~7.5MB
~200K SLoC