Python 如何使用PyICU将unicode文本音译为ASCII?

Python 如何使用PyICU将unicode文本音译为ASCII?,python,character-encoding,ascii,icu,pyicu,Python,Character Encoding,Ascii,Icu,Pyicu,有一个库,据我所知,它可以用来音译字符串。但是没有文档。有没有人举一个简单的例子,将unicode字符串翻译成ASCII,用 C++文档,但我不知道如何从Python调用它。 < P>从你给出的第一个链接,我假设 1) 你已经建立了PyICU 2) 您已确保可以访问该库 (如果您没有上述内容,请参阅链接页面上的文档) 我从您的链接中找到了此文档: 要将非utf-8编码的Python str转换为ICU UnicodeString,请使用UnicodeString(str,encodingNam

有一个库,据我所知,它可以用来音译字符串。但是没有文档。有没有人举一个简单的例子,将unicode字符串翻译成ASCII,用


C++文档,但我不知道如何从Python调用它。

< P>从你给出的第一个链接,我假设 1) 你已经建立了PyICU 2) 您已确保可以访问该库 (如果您没有上述内容,请参阅链接页面上的文档)

我从您的链接中找到了此文档:

要将非utf-8编码的Python str转换为ICU UnicodeString,请使用UnicodeString(str,encodingName)构造函数

所以你需要找到编码名称,我想你的应该是ASCII码(你应该检查以确保它是正确的,我没有费心)

那么我想你会这样做:

>>> from icu import UnicodeString
 . 
 .
 . 
>>> string = UnicodeString(strToConvert, ASCII)
这只是一个简单的想法,ymmv。您可能希望查看该网站,因为它提供了更多示例,以及如何使用“Python方式”或“ICU方式”进行操作。
干杯

这里有一个很好的PyICU备忘:

下面是一个稍加修改的示例:

>>> import icu
>>> tl = icu.Transliterator.createInstance('Any-Latin; Latin-ASCII')
>>> tl.transliterate('Ψάπφω')
'Psappho'

相关:@J.F.Sebastian,谢谢,我真的找到了,并且去了。但我仍然认为这个问题有一定的价值,所以我放弃了它;只需扫描文档,查找ASCII应该使用的符号。您可以尝试一些类似iso-646、iso-8859甚至ascii的方法。