Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/326.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 这些字符叫什么:etc尝试拆分句子时会停止使用非标准字符_Python - Fatal编程技术网

Python 这些字符叫什么:etc尝试拆分句子时会停止使用非标准字符

Python 这些字符叫什么:etc尝试拆分句子时会停止使用非标准字符,python,Python,我正试图用…来分句!等等,但在某些语言中,它们具有非标准字符。比如英语。还有日语 这些字符的名称是什么,这样我就可以在我的分句方法中添加所有不同的变体 这是一个unicode字符。在日语中,它被称为a。它有Unicode U+3002 In [8]: print(u'\u3002') 。 因此,要在Python中基于此字符进行拆分: l = s.split(u'\u3002') l将是由字符串s中的句号分隔符分割的字符串列表 你可以用任何字符分割一个句子。我会查找您正在使用的语言的标点符号,

我正试图用…来分句!等等,但在某些语言中,它们具有非标准字符。比如英语。还有日语


这些字符的名称是什么,这样我就可以在我的分句方法中添加所有不同的变体

这是一个unicode字符。在日语中,它被称为a。它有Unicode U+3002

In [8]: print(u'\u3002')
。
因此,要在Python中基于此字符进行拆分:

l = s.split(u'\u3002')
l将是由字符串s中的句号分隔符分割的字符串列表

你可以用任何字符分割一个句子。我会查找您正在使用的语言的标点符号,并复制您想要使用的utf-8字符

>>> str = "私は擬人です。それを水ですか?"
>>> for x in str.split("。"):
...     print(x)
... 
私は擬人です
それを水ですか?

这些被称为标点符号或特殊字符。有Unicode字符的表格,例如。可能重复的字符名称如何帮助使用拆分方法?或者你真的想要一个可以结束一个句子的字符列表?