Python 在语料库类别中查找单词的上下文不'；行不通_Python_Nltk

Python 在语料库类别中查找单词的上下文不'；行不通

python

Python 在语料库类别中查找单词的上下文不'；行不通,python,nltk,Python,Nltk,我写这个小脚本是为了找到语料库中10个最常见单词的上下文。但它不起作用，我也不知道我做错了什么。tien_frequentste（mijn_语料库）的定义本身就起作用 tienfrequentste = tien_frequentste(mijncorpus) def context (corpus, most_freq): for category in corpus.categories(): print "Context voor" , category, ":"

我写这个小脚本是为了找到语料库中10个最常见单词的上下文。但它不起作用，我也不知道我做错了什么。tien_frequentste（mijn_语料库）的定义本身就起作用

tienfrequentste = tien_frequentste(mijncorpus)
def context (corpus, most_freq):
   for category in corpus.categories():
     print "Context voor" , category, ":"
       for word in most_freq:
           print nltk.Text(corpus.words(categories=category)).concordance(word)

更新：
我在回溯时收到一条错误消息
对于

上下文（语料库，最常见）

，
对于corpus.categories（）中的

类别，

对于self.init（）


和中的
。
并且一个AttributeError:“非类型”对象没有属性“组”


不知道这些错误是什么意思
Traceback (most recent call last):
 File "/Users/...document.py", line 92, in <module> context (mijn_corpus, tienfrequentste)

 File "/Users/...document.py", line 87, in context for category in corpus.categories(): File "/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/site-packages/nltk.corpus.reader.api.py, line 317, in categories self.init().

File "/Users/...document.py", line 87, in context for category in corpus.categories(): File "/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/site-packages/nltk.corpus.reader.api.py, line 289, in_init category = re.match(self._pattern, file id).group(1)

attributeError: 'Nonetype' object has no attribute "group"

回溯（最近一次呼叫最后一次）：
文件“/Users/…document.py”，第92行，在上下文中（mijn_语料库，tienfrequentste）
文件“/Users/…document.py”，第87行，在categories self.init（）中的categories上下文中：文件“/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/site-packages/nltk.corpus.reader.api.py，第317行。
文件“/Users/…document.py”，第87行，在corpus.categories（）中的类别上下文中：文件“/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/site-packages/nltk.corpus.reader.api.py，第289行，在_init category=re.match（self.\u模式，文件id）.group（1）
attributeError:“非类型”对象没有属性“组”
您的语料库是否有类别，并且是最常见的字符串列表？以下示例有效：
from nltk.corpus import reuters
for category in reuters.categories():
print "context voor", category, " : "
for word in ["get", "have", "do"]:
    print nltk.Text(reuters.words(categories=category)).concordance(word)

错误来自将语料库文件分配给类别的正则表达式。它遇到了与regexp模式不匹配的文件名。如果您使用的是带有类别的标准NLTK语料库，则必须在语料库目录中放置一个额外的文件。如果你使用的是你自己的语料库，那就错了
顺便提一下，concordance（）
打印其输出并返回None
。如果使用print
，您会看到一大堆None
值。
它就是不起作用吗？你有没有发现错误？你提供的信息越多，就越容易理解help@Gareth韦伯我用错误消息的信息编辑了我的问题。你为什么不简单地复制粘贴错误在这里，这样理解问题会容易得多，知道确切的轨迹反馈这是另一个问题，每次我试图复制或粘贴Python中的任何内容时，它都会关闭并报告一条错误消息。@paddila由于复制粘贴不起作用，所以我手动复制了错误消息。希望这有点道理。