Python 3.x 文本文件中的词性标记_Python 3.x_Nltk

Python 3.x 文本文件中的词性标记

python-3.x

Python 3.x 文本文件中的词性标记,python-3.x,nltk,Python 3.x,Nltk,我有个问题。我想在包含以下句子的文本文件（file1.txt）中应用词性标记：你好，世界你好吗首先我想标记它，然后使用POS标记器。我知道如何标记和标记字符串的单词。但我不知道如何在文件中完成它。任何帮助都将不胜感激。您只需将脚本指向文件所在的文件夹（或更具体地说，路径）： path = 'C:\Scripts\My_Scripts\file1.txt' 然后将其插入到代码中，以打开它，并像正常操作一样对其进行操作，就像将所有内容都设置为小写一样，例如： with open(path)

我有个问题。我想在包含以下句子的文本文件（file1.txt）中应用词性标记：

你好，世界

你好吗

首先我想标记它，然后使用POS标记器。我知道如何标记和标记字符串的单词。但我不知道如何在文件中完成它。任何帮助都将不胜感激。

您只需将脚本指向文件所在的文件夹（或更具体地说，路径）：

path = 'C:\Scripts\My_Scripts\file1.txt'

然后将其插入到代码中，以打开它，并像正常操作一样对其进行操作，就像将所有内容都设置为小写一样，例如：

with open(path) as sample_text:
     for lines in sample_text:
          lowers = lines.lower()

读这个文件，然后你有一个字符串，你可以标记和标记。我得到的输出是：[（'H'，'NNP'），（'E'，'NNP'））…我试图逐字阅读，但它在整个文件中逐字阅读。为什么？因为你没有标记它。如果你真的对字符串做了同样的操作，你也会遇到同样的问题。编辑你的问题以显示导致问题的代码，你很可能会得到快速帮助。这就是这个网站的工作方式。试一试od（即仔细书写的）问题，得到一个好的答案。这是一种非常糟糕的阅读文件进行词性标注的方式。你逐行阅读，但句子跨越了行边界。