Internationalization 在哪里可以找到汉字bopomofo/拼音数据?

Internationalization 在哪里可以找到汉字bopomofo/拼音数据?,internationalization,dataset,chinese-locale,opendata,Internationalization,Dataset,Chinese Locale,Opendata,我正在寻找一个数据集,其中包含所有汉字的汉语拼音和/或拼音发音。另外,我需要开源数据集,我可以将其复制到我自己的代码库中。听起来您可能正在寻找Unihan数据库。Unihan数据库由Unicode联盟维护 Unihan数据库是Unicode联盟的集体知识库 关于Unicode标准中包含的CJK统一表意文字。它包含 映射数据以允许与其他编码字符集和其他 帮助实现对使用汉语言的各种语言的支持的信息 表意文字 举个例子,这里是 这是Unihan数据库的一部分。请务必阅读这些内容,以了解数据所指的内容

我正在寻找一个数据集,其中包含所有汉字的汉语拼音和/或拼音发音。另外,我需要开源数据集,我可以将其复制到我自己的代码库中。

听起来您可能正在寻找Unihan数据库。Unihan数据库由Unicode联盟维护

Unihan数据库是Unicode联盟的集体知识库 关于Unicode标准中包含的CJK统一表意文字。它包含 映射数据以允许与其他编码字符集和其他 帮助实现对使用汉语言的各种语言的支持的信息 表意文字

举个例子,这里是

这是Unihan数据库的一部分。请务必阅读这些内容,以了解数据所指的内容

如果这是您想要的信息,您可以选择包含所有这些数据的

Unihan数据库没有Bopomofo(竹音)发音,但有拼音读数。从拼音到竹音的转换很简单;有很多在线工具可以帮你做到这一点


至于许可证问题,Unihan数据库数据文件已经发布。因此,在您自己的软件中使用这些数据时不应该遇到任何问题。

听起来您可能在寻找Unihan数据库。Unihan数据库由Unicode联盟维护

Unihan数据库是Unicode联盟的集体知识库 关于Unicode标准中包含的CJK统一表意文字。它包含 映射数据以允许与其他编码字符集和其他 帮助实现对使用汉语言的各种语言的支持的信息 表意文字

举个例子,这里是

这是Unihan数据库的一部分。请务必阅读这些内容,以了解数据所指的内容

如果这是您想要的信息,您可以选择包含所有这些数据的

Unihan数据库没有Bopomofo(竹音)发音,但有拼音读数。从拼音到竹音的转换很简单;有很多在线工具可以帮你做到这一点


至于许可证问题,Unihan数据库数据文件已经发布。因此,在您自己的软件中使用这些数据时不应该遇到任何问题。

这是一个有点晚的条目,但我去年搜索了相同的内容,最后根据一系列不同的数据集编译了我自己的character/bopomofo数据库。我已经在这件事上做了足够多的工作,完全可以称之为我自己的,所以你应该去看看!这是我用bopomofo分类的rubygem的一部分(我有一个系统不允许我更改数据库的collation设置)

这是一个有点晚的条目,但我去年搜索了同样的东西,最后根据一堆不同的数据集编译了我自己的字符/bopomofo数据库。我已经在这件事上做了足够多的工作,完全可以称之为我自己的,所以你应该去看看!这是我用bopomofo制作的rubygem排序系统的一部分(我有一个系统,不允许我更改数据库collation设置)

谢谢!我已经发现了,但unihan似乎更适合这个问题。我还写了一个JS拼音到竹音的转换器:谢谢!我已经发现了,但unihan似乎更适合这个问题。我还写了一个JS拼音到竹音的转换器: