Python nltk.word\u标记化应用于路径_Python_Nltk

Python nltk.word\u标记化应用于路径

python

Python nltk.word\u标记化应用于路径,python,nltk,Python,Nltk,您好，是否有方法将此代码应用于我的文件路径？而不是“现在有了完全不同的东西”？导入nltk text=nltk.word\u tokenize（“现在是完全不同的东西”）打印（nltk.pos_标签（文本））假设您有一个.txt文件，您可以打开并读取它的内容 text.txt This file is for testing purposes. python文件导入nltk 文件=打开（“text.txt”、“r”）对于文件中的行： text=nltk.word\u标记化（行）打印

您好，是否有方法将此代码应用于我的文件路径？而不是“现在有了完全不同的东西”？

导入nltk
text=nltk.word\u tokenize（“现在是完全不同的东西”）
打印（nltk.pos_标签（文本））

假设您有一个.txt文件，您可以打开并读取它的内容

text.txt

This file is for testing purposes.

python文件

导入nltk
文件=打开（“text.txt”、“r”）
对于文件中的行：
text=nltk.word\u标记化（行）
打印（nltk.pos_标签（文本））
#输出
#[（'This'，'DT'），（'file'，'NN'），（'is'，'VBZ'），（'for'，'IN'），（'testing'，'VBG'），（'purposes'，'NNS'），（'is'，'VBZ'），（'for'，'IN'），（'testing'，'VBG'），（'purposes'，'NNS'），（'

谢谢！代码是工作！但是，如果我只想在文本中找到法语单词，有没有解决办法？我不认为你可以只使用纯NLTK。如果我没弄错的话，NLTK是为英语单词构建的，你需要找到另一个NLTK法语单词包。非常感谢。我已经向您发送了电子邮件。我认为这是使用nltk中更多语言的一种方式。标记化从nltk导入TreebankWordTokenizer从nltk导入lesk从nltk.corpus导入wordnet作为wn#['als'，'arb'，'cat'，'cmn'，'dan'，'eng'，'eus'，'fas'，'fin'，'fra'，'fre'，'glg'，'heb'，'ind'，'ita'，'jpn'，'nno'，'nob'，'pol'，'por'，'spa'，'tha'，'zsm']lang fra'sent=TreebankWordTokenizer（）.tokenize（“Je voudrai essayer-avec-cette短语”）语法集=[lesk（sent，w，'n'）in-in-sent]打印（语法集）