Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/301.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
使用Python、NLTK分析德语文本_Python_Nltk_Tokenize_Corpus - Fatal编程技术网

使用Python、NLTK分析德语文本

使用Python、NLTK分析德语文本,python,nltk,tokenize,corpus,Python,Nltk,Tokenize,Corpus,我是Python初学者,目前正尝试使用NLTK分析德语文本(提取德语名词及其在德语文本中的频率),方法如下: 在这个过程中,我遇到了几个问题,但我无法解决它们 当我跟随网站执行以下代码时: import random tagged_sents = list(corp.tagged_sents()) random.shuffle(tagged_sents) split_perc = 0.1 split_size = int(len(tagged_sents) * split_perc) trai

我是Python初学者,目前正尝试使用NLTK分析德语文本(提取德语名词及其在德语文本中的频率),方法如下:

在这个过程中,我遇到了几个问题,但我无法解决它们

当我跟随网站执行以下代码时:

import random

tagged_sents = list(corp.tagged_sents())
random.shuffle(tagged_sents)
split_perc = 0.1
split_size = int(len(tagged_sents) * split_perc)
train_sents, test_sents = tagged_sents[split_size:], tagged_sents[:split_size]
结果就是这样

Traceback (most recent call last):
  File "test2.py", line 7, in <module>
    tagged_sents = list(corp.tagged_sents())
  File "C:\Users\User\anaconda3\lib\site-packages\nltk\corpus\reader\conll.py", line 130, in tagged_sents
    return LazyMap(get_tagged_words, self._grids(fileids))
  File "C:\Users\User\anaconda3\lib\site-packages\nltk\corpus\reader\conll.py", line 215, in _grids
    return concat(
  File "C:\Users\User\anaconda3\lib\site-packages\nltk\corpus\reader\util.py", line 433, in concat
    raise ValueError("concat() expects at least one object!")
ValueError: concat() expects at least one object!
它表明

Traceback (most recent call last):
  File "test1.py", line 90, in <module>
    from ClassifierBasedGermanTagger.ClassifierBasedGermanTagger import ClassifierBasedGermanTagger
ModuleNotFoundError: No module named 'ClassifierBasedGermanTagger' 
回溯(最近一次呼叫最后一次):
文件“test1.py”,第90行,在
从ClassifierBaseGermanAger.ClassifierBaseGermanAger导入ClassifierBaseGermanAger
ModuleNotFoundError:没有名为“ClassifierBasedGermanAger”的模块
我已经下载了ClassifierBasedGermantager.py和init.py,并将它们放在链接到VS代码的文件夹中,不知道它是否正确,正如文章所说:

“使用他的Python类ClassifierBasedGermanAger(您可以从github页面下载),我们可以创建一个标记器,并使用TIGER语料库中的数据对其进行训练:”


请帮我解决这些问题,谢谢

首先,欢迎来到StackOverflow!在发布问题之前,请确保您已经完成了自己的研究,并且大部分时间它都解决了问题

其次,
range(start,end)
在Python中是一个非常基本的函数,用于根据输入获取数字列表,我认为像您那样使用它不会解决问题。我建议您使用
print
查看
corp
中填充了什么样的数据,并从那里开始调试。也许
corp
是空的,这就是为什么你没有得到任何
标记

对于导入部件,我不清楚您将
classifierbasedGermantager.py放置在何处,但无论它在何处,您的代码都看不到它。您可以尝试将代码(
test2.py
)和
classifierbasedGermantager.py
放在同一目录中。阅读下面的链接,了解有关如何在Python中正确导入模块的更多详细信息

Traceback (most recent call last):
  File "test1.py", line 90, in <module>
    from ClassifierBasedGermanTagger.ClassifierBasedGermanTagger import ClassifierBasedGermanTagger
ModuleNotFoundError: No module named 'ClassifierBasedGermanTagger'