Nlp 在nps_聊天语料库上训练单字标记问题_Nlp_Nltk

Nlp 在nps_聊天语料库上训练单字标记问题

nlp

Nlp 在nps_聊天语料库上训练单字标记问题,nlp,nltk,Nlp,Nltk,起初，我试着在标记的句子上训练标记者，但与使用 Brown，nps聊天语料库似乎没有采用taged_sents（）方法。因此，我尝试对标记的单词进行训练，Python返回了错误信息： > Traceback (most recent call last): File "<pyshell#55>", line 1, in > <module> > unigram_tagger = nltk.UnigramTagger(training_

起初，我试着在标记的句子上训练标记者，但与使用 Brown，nps聊天语料库似乎没有采用taged_sents（）方法。因此，我尝试对标记的单词进行训练，Python返回了错误信息：

> Traceback (most recent call last):    File "<pyshell#55>", line 1, in
> <module> 
>     unigram_tagger = nltk.UnigramTagger(training_set)    File
> "C:\Python26\lib\site-packages\nltk\tag\sequential.py", line 287, in 
> __init__ 
>     backoff, cutoff, verbose)    File
> "C:\Python26\lib\site-packages\nltk\tag\sequential.py", line 270, in 
> __init__ 
>     self._train(train, cutoff, verbose)    File
> "C:\Python26\lib\site-packages\nltk\tag\sequential.py", line 181, in 
> _train 
>     tokens, tags = zip(*sentence)  ValueError: need more than 1 value
> to unpack

>回溯（最后一次调用）：文件“”，第1行，在
>  
>unigram_tagger=nltk.UnigramTagger（训练集）文件
>“C:\Python26\lib\site packages\nltk\tag\sequential.py”，第287行，在
>_uuuinit_uuu
>退避、切断、详细）文件
>“C:\Python26\lib\site packages\nltk\tag\sequential.py”，第270行，在
>_uuuinit_uuu
>self.\u序列（序列、截止、详细）文件
>“C:\Python26\lib\site packages\nltk\tag\sequential.py”，中的第181行
>_列车
>标记，标记=zip（*句）值错误：需要超过1个值
>拆开

我怀疑这个问题与我试图训练打标签的人使用带标签的单词而不是句子，但是有什么好处呢如果nps聊天不采用tagged_sents方法，该问题的解决方案是什么？为什么

它不接受那种方法吗？请告知

培训标记员使用

标记的帖子（）

方法。