如何在python中将泰米尔unicode值数组转换为带空格的泰米尔字符串？_Python_Unicode_Tamil_Python Unicode_Indic

如何在python中将泰米尔unicode值数组转换为带空格的泰米尔字符串？

python unicode

如何在python中将泰米尔unicode值数组转换为带空格的泰米尔字符串？,python,unicode,tamil,python-unicode,indic,Python,Unicode,Tamil,Python Unicode,Indic,以下是泰米尔unicode代码点列表 [u'\u0b9a'，u'\u0b9f'，u'\u0bcd'，u'\u0b9f'，u'\u0b9a'，u'\u0baa'，u'\u0baf'，u'\u0bbf'，u'\u0bcd'，u'\u0ba8'，u'\u0bc7'，u'\u0bb1'，u'\u0bcd'，u'\u0bc1] 如何将其转换为可读字符串？无需转换 >>> alist = [ u'\u0b9a', u'\u0b9f', u'\u0bcd',

以下是泰米尔unicode代码点列表

[u'\u0b9a'，u'\u0b9f'，u'\u0bcd'，u'\u0b9f'，u'\u0b9a'，u'\u0baa'，u'\u0baf'，u'\u0bbf'，u'\u0bcd'，u'\u0ba8'，u'\u0bc7'，u'\u0bb1'，u'\u0bcd'，u'\u0bc1]

如何将其转换为可读字符串？

无需转换

    >>> alist = [
            u'\u0b9a', u'\u0b9f', u'\u0bcd', u'\u0b9f', u'\u0b9a',
            u'\u0baa', u'\u0bc8', u'\u0baf', u'\u0bbf', u'\u0bb2',
            u'\u0bcd', u'\u0ba8', u'\u0bc7', u'\u0bb1', u'\u0bcd',
            u'\u0bb1', u'\u0bc1',
            ]
    >>> print u''.join(alist)
    சட்டசபையில்நேற்று
    >>>

更新：也许你想要这个：

>>> print u' '.join(alist)
ச ட ் ட ச ப ை ய ி ல ் ந ே ற ் ற ு

或者这个：

>>> import unicodedata
>>> for c in alist:
    print repr(c), c, unicodedata.category(c)


u'\u0b9a' ச Lo
u'\u0b9f' ட Lo
u'\u0bcd' ் Mn
u'\u0b9f' ட Lo
u'\u0b9a' ச Lo
u'\u0baa' ப Lo
u'\u0bc8' ை Mc
u'\u0baf' ய Lo
u'\u0bbf' ி Mc
u'\u0bb2' ல Lo
u'\u0bcd' ் Mn
u'\u0ba8' ந Lo
u'\u0bc7' ே Mc
u'\u0bb1' ற Lo
u'\u0bcd' ் Mn
u'\u0bb1' ற Lo
u'\u0bc1' ு Mc
>>>

那些已经是泰米尔字母了。再试一次。我看到你已经改变了你的问题；您现在想显示“带空格”的字符——哪个空格字符？有多少定位在哪里？试着给出一个例子。先生，我希望泰米尔语的unicode以带空格的阵列形式打印。我不希望将内容加入数组并以泰米尔语字符显示。实际上，我希望标记泰米尔语。为了标记化，应将其转换为utf-8 unicode以读取文件。读取后应标记化。结果将必须使用unicode。我希望将unicode的结果转换为泰米尔字母。但是我在标记泰米尔语单词时没有空格。我在标记泰米尔语单词时，每个单词都需要空格，但每个字符都不需要空格。谢谢你的宝贵回复