Python 3.x 文本文件中的词性标记

Python 3.x 文本文件中的词性标记,python-3.x,nltk,Python 3.x,Nltk,我有个问题。我想在包含以下句子的文本文件(file1.txt)中应用词性标记: 你好,世界 你好吗 首先我想标记它,然后使用POS标记器。我知道如何标记和标记字符串的单词。但我不知道如何在文件中完成它。任何帮助都将不胜感激。您只需将脚本指向文件所在的文件夹(或更具体地说,路径): path = 'C:\Scripts\My_Scripts\file1.txt' 然后将其插入到代码中,以打开它,并像正常操作一样对其进行操作,就像将所有内容都设置为小写一样,例如: with open(path)

我有个问题。我想在包含以下句子的文本文件(file1.txt)中应用词性标记:

你好,世界

你好吗


首先我想标记它,然后使用POS标记器。我知道如何标记和标记字符串的单词。但我不知道如何在文件中完成它。任何帮助都将不胜感激。

您只需将脚本指向文件所在的文件夹(或更具体地说,路径):

path = 'C:\Scripts\My_Scripts\file1.txt'
然后将其插入到代码中,以打开它,并像正常操作一样对其进行操作,就像将所有内容都设置为小写一样,例如:

with open(path) as sample_text:
     for lines in sample_text:
          lowers = lines.lower()

读这个文件,然后你有一个字符串,你可以标记和标记。我得到的输出是:[('H','NNP'),('E','NNP'))…我试图逐字阅读,但它在整个文件中逐字阅读。为什么?因为你没有标记它。如果你真的对字符串做了同样的操作,你也会遇到同样的问题。编辑你的问题以显示导致问题的代码,你很可能会得到快速帮助。这就是这个网站的工作方式。试一试od(即仔细书写的)问题,得到一个好的答案。这是一种非常糟糕的阅读文件进行词性标注的方式。你逐行阅读,但句子跨越了行边界。