Python nltk.word\u标记化应用于路径

Python nltk.word\u标记化应用于路径,python,nltk,Python,Nltk,您好,是否有方法将此代码应用于我的文件路径?而不是“现在有了完全不同的东西”? 导入nltk text=nltk.word\u tokenize(“现在是完全不同的东西”) 打印(nltk.pos_标签(文本)) 假设您有一个.txt文件,您可以打开并读取它的内容 text.txt This file is for testing purposes. python文件 导入nltk 文件=打开(“text.txt”、“r”) 对于文件中的行: text=nltk.word\u标记化(行) 打印

您好,是否有方法将此代码应用于我的文件路径?而不是“现在有了完全不同的东西”?

导入nltk
text=nltk.word\u tokenize(“现在是完全不同的东西”)
打印(nltk.pos_标签(文本))

假设您有一个.txt文件,您可以打开并读取它的内容

text.txt

This file is for testing purposes.
python文件

导入nltk
文件=打开(“text.txt”、“r”)
对于文件中的行:
text=nltk.word\u标记化(行)
打印(nltk.pos_标签(文本))
#输出
#[('This','DT'),('file','NN'),('is','VBZ'),('for','IN'),('testing','VBG'),('purposes','NNS'),('is','VBZ'),('for','IN'),('testing','VBG'),('purposes','NNS'),('

谢谢!代码是工作!但是,如果我只想在文本中找到法语单词,有没有解决办法?我不认为你可以只使用纯NLTK。如果我没弄错的话,NLTK是为英语单词构建的,你需要找到另一个NLTK法语单词包。非常感谢。我已经向您发送了电子邮件。我认为这是使用nltk中更多语言的一种方式。标记化从nltk导入TreebankWordTokenizer从nltk导入lesk从nltk.corpus导入wordnet作为wn#['als','arb','cat','cmn','dan','eng','eus','fas','fin','fra','fre','glg','heb','ind','ita','jpn','nno','nob','pol','por','spa','tha','zsm']lang fra'sent=TreebankWordTokenizer().tokenize(“Je voudrai essayer-avec-cette短语”)语法集=[lesk(sent,w,'n')in-in-sent]打印(语法集)