Python 这些字符叫什么:etc尝试拆分句子时会停止使用非标准字符
我正试图用…来分句!等等,但在某些语言中,它们具有非标准字符。比如英语。还有日语Python 这些字符叫什么:etc尝试拆分句子时会停止使用非标准字符,python,Python,我正试图用…来分句!等等,但在某些语言中,它们具有非标准字符。比如英语。还有日语 这些字符的名称是什么,这样我就可以在我的分句方法中添加所有不同的变体 这是一个unicode字符。在日语中,它被称为a。它有Unicode U+3002 In [8]: print(u'\u3002') 。 因此,要在Python中基于此字符进行拆分: l = s.split(u'\u3002') l将是由字符串s中的句号分隔符分割的字符串列表 你可以用任何字符分割一个句子。我会查找您正在使用的语言的标点符号,
这些字符的名称是什么,这样我就可以在我的分句方法中添加所有不同的变体 这是一个unicode字符。在日语中,它被称为a。它有Unicode U+3002
In [8]: print(u'\u3002')
。
因此,要在Python中基于此字符进行拆分:
l = s.split(u'\u3002')
l将是由字符串s中的句号分隔符分割的字符串列表
你可以用任何字符分割一个句子。我会查找您正在使用的语言的标点符号,并复制您想要使用的utf-8字符
>>> str = "私は擬人です。それを水ですか?"
>>> for x in str.split("。"):
... print(x)
...
私は擬人です
それを水ですか?
这些被称为标点符号或特殊字符。有Unicode字符的表格,例如。可能重复的字符名称如何帮助使用拆分方法?或者你真的想要一个可以结束一个句子的字符列表?