Nlp 在nps_聊天语料库上训练单字标记问题
起初,我试着在标记的句子上训练标记者,但与使用 Brown,nps聊天语料库似乎没有采用taged_sents()方法。 因此,我尝试对标记的单词进行训练,Python返回了错误 信息:Nlp 在nps_聊天语料库上训练单字标记问题,nlp,nltk,Nlp,Nltk,起初,我试着在标记的句子上训练标记者,但与使用 Brown,nps聊天语料库似乎没有采用taged_sents()方法。 因此,我尝试对标记的单词进行训练,Python返回了错误 信息: > Traceback (most recent call last): File "<pyshell#55>", line 1, in > <module> > unigram_tagger = nltk.UnigramTagger(training_
> Traceback (most recent call last): File "<pyshell#55>", line 1, in
> <module>
> unigram_tagger = nltk.UnigramTagger(training_set) File
> "C:\Python26\lib\site-packages\nltk\tag\sequential.py", line 287, in
> __init__
> backoff, cutoff, verbose) File
> "C:\Python26\lib\site-packages\nltk\tag\sequential.py", line 270, in
> __init__
> self._train(train, cutoff, verbose) File
> "C:\Python26\lib\site-packages\nltk\tag\sequential.py", line 181, in
> _train
> tokens, tags = zip(*sentence) ValueError: need more than 1 value
> to unpack
>回溯(最后一次调用):文件“”,第1行,在
>
>unigram_tagger=nltk.UnigramTagger(训练集)文件
>“C:\Python26\lib\site packages\nltk\tag\sequential.py”,第287行,在
>_uuuinit_uuu
>退避、切断、详细)文件
>“C:\Python26\lib\site packages\nltk\tag\sequential.py”,第270行,在
>_uuuinit_uuu
>self.\u序列(序列、截止、详细)文件
>“C:\Python26\lib\site packages\nltk\tag\sequential.py”,中的第181行
>_列车
>标记,标记=zip(*句)值错误:需要超过1个值
>拆开
我怀疑这个问题与我试图
训练打标签的人使用带标签的单词而不是句子,但是有什么好处呢
如果nps聊天不采用tagged_sents方法,该问题的解决方案是什么?为什么
它不接受那种方法吗?请告知 培训标记员使用
标记的帖子()
方法。