Warning: file_get_contents(/data/phpspider/zhask/data//catemap/6/xamarin/3.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 在语料库类别中查找单词的上下文不';行不通_Python_Nltk - Fatal编程技术网

Python 在语料库类别中查找单词的上下文不';行不通

Python 在语料库类别中查找单词的上下文不';行不通,python,nltk,Python,Nltk,我写这个小脚本是为了找到语料库中10个最常见单词的上下文。但它不起作用,我也不知道我做错了什么。tien_frequentste(mijn_语料库)的定义本身就起作用 tienfrequentste = tien_frequentste(mijncorpus) def context (corpus, most_freq): for category in corpus.categories(): print "Context voor" , category, ":"

我写这个小脚本是为了找到语料库中10个最常见单词的上下文。但它不起作用,我也不知道我做错了什么。tien_frequentste(mijn_语料库)的定义本身就起作用

tienfrequentste = tien_frequentste(mijncorpus)
def context (corpus, most_freq):
   for category in corpus.categories():
     print "Context voor" , category, ":"
       for word in most_freq:
           print nltk.Text(corpus.words(categories=category)).concordance(word)
更新:
我在回溯时收到一条错误消息
对于
上下文(语料库,最常见)

对于corpus.categories()中的
类别,
对于
self.init()

中的
。 并且一个
AttributeError:“非类型”对象没有属性“组”

不知道这些错误是什么意思

Traceback (most recent call last):
 File "/Users/...document.py", line 92, in <module> context (mijn_corpus, tienfrequentste)

 File "/Users/...document.py", line 87, in context for category in corpus.categories(): File "/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/site-packages/nltk.corpus.reader.api.py, line 317, in categories self.init().

File "/Users/...document.py", line 87, in context for category in corpus.categories(): File "/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/site-packages/nltk.corpus.reader.api.py, line 289, in_init category = re.match(self._pattern, file id).group(1)

attributeError: 'Nonetype' object has no attribute "group"
回溯(最近一次呼叫最后一次):
文件“/Users/…document.py”,第92行,在上下文中(mijn_语料库,tienfrequentste)
文件“/Users/…document.py”,第87行,在categories self.init()中的categories上下文中:文件“/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/site-packages/nltk.corpus.reader.api.py,第317行。
文件“/Users/…document.py”,第87行,在corpus.categories()中的类别上下文中:文件“/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/site-packages/nltk.corpus.reader.api.py,第289行,在_init category=re.match(self.\u模式,文件id).group(1)
attributeError:“非类型”对象没有属性“组”

您的语料库是否有类别,并且
是最常见的字符串列表?以下示例有效:

from nltk.corpus import reuters
for category in reuters.categories():
print "context voor", category, " : "
for word in ["get", "have", "do"]:
    print nltk.Text(reuters.words(categories=category)).concordance(word)

错误来自将语料库文件分配给类别的正则表达式。它遇到了与regexp模式不匹配的文件名。如果您使用的是带有类别的标准NLTK语料库,则必须在语料库目录中放置一个额外的文件。如果你使用的是你自己的语料库,那就错了


顺便提一下,
concordance()
打印其输出并返回
None
。如果使用
print
,您会看到一大堆
None
值。

它就是不起作用吗?你有没有发现错误?你提供的信息越多,就越容易理解help@Gareth韦伯我用错误消息的信息编辑了我的问题。你为什么不简单地复制粘贴错误在这里,这样理解问题会容易得多,知道确切的轨迹反馈这是另一个问题,每次我试图复制或粘贴Python中的任何内容时,它都会关闭并报告一条错误消息。@paddila由于复制粘贴不起作用,所以我手动复制了错误消息。希望这有点道理。