Python 3.x 我如何用标点符号将一个句子拆分成独立的单词?
使用Python3.x,我需要将一个句子拆分为单独的单词和标点符号 e、 “这是一个句子。” 分成 [“这”、“是”、“a”、“句子”、“句子”]Python 3.x 我如何用标点符号将一个句子拆分成独立的单词?,python-3.x,Python 3.x,使用Python3.x,我需要将一个句子拆分为单独的单词和标点符号 e、 “这是一个句子。” 分成 [“这”、“是”、“a”、“句子”、“句子”] 我正在尝试使用for循环匹配单词,但是如果我尝试匹配单词“句子”,它将不匹配,因为当我在空白处使用.split()时,它将变为“句子”,而不是“句子”,并且由于标点符号而不匹配。执行此操作的最佳方法是什么?使用拆分(“,:”)和任何其他您想要的分隔符。在要拆分的标记列表中添加标点符号。应该是正则表达式:使用标记器:事实上,不要试图重新发明轮子:它工作
我正在尝试使用for循环匹配单词,但是如果我尝试匹配单词“句子”,它将不匹配,因为当我在空白处使用.split()时,它将变为“句子”,而不是“句子”,并且由于标点符号而不匹配。执行此操作的最佳方法是什么?使用拆分(“,:”)和任何其他您想要的分隔符。在要拆分的标记列表中添加标点符号。应该是正则表达式:使用标记器:事实上,不要试图重新发明轮子:它工作得相当好。请查看下面给出的nltk标记器示例。使用
s=“这也是一个句子,真的”
,s.split(,;”)
将导致[“这也是一个句子,真的”
,因为你在组合“,;”上分裂了。