Python 为什么我会得到;ValueError:列数不一致;从.ConLL文件中读取句子时? 从nltk.corpus.reader.conll导入ConllCorpusReader READER=ConllCorpusReader(root=“./”,fileid=“.conll”, columntypes=('words'、'pos'、'tree'、'chunk'、'ne'、'srl'、'ignore') ) 读卡器(myConLLfile)
我正在从Python 为什么我会得到;ValueError:列数不一致;从.ConLL文件中读取句子时? 从nltk.corpus.reader.conll导入ConllCorpusReader READER=ConllCorpusReader(root=“./”,fileid=“.conll”, columntypes=('words'、'pos'、'tree'、'chunk'、'ne'、'srl'、'ignore') ) 读卡器(myConLLfile),python,nltk,valueerror,conll,Python,Nltk,Valueerror,Conll,我正在从.conll文件中将句子提取为字符串列表。上面的代码没有报告任何错误,因此我认为每个句子都提取了一些内容。然而,当我试图打印出每个句子或在每个句子中添加词性标签时,下面的值错误会出现在第1007个句子之后的每个句子中 发生了什么事?有没有办法查看那些被提取但结构不良的句子? 如何正确地提取句子?我猜有些标记表示为字符串和OBI的元组,而不是字符串。但是很多句子都有相同的错误报告,这很奇怪 更糟糕的情况是,我能只提取那些结构良好的句子吗? i=0 对于READER_sents(MyConl
.conll
文件中将句子提取为字符串列表。上面的代码没有报告任何错误,因此我认为每个句子都提取了一些内容。然而,当我试图打印出每个句子或在每个句子中添加词性标签时,下面的值错误会出现在第1007个句子之后的每个句子中
i=0
对于READER_sents(MyConlFile)中的句子:
印刷品(一)
打印(句子)
i+=1
---------------------------------------------------------------------------
ValueError回溯(最近一次调用上次)
在()
1 i=0
---->2对于READER.sents(mycolfile)中的句子:
3印刷品(一)
4印刷品(句子)
5i+=1
2帧
/usr/local/lib/python3.6/dist-packages/nltk/corpus/reader/conll.py in_read_grid_块(self,stream)
206如果列(世界其他地区)!=len(网格[0]):
207 raise VALUERROR('列数不一致:\n%s'
-->208%块)
209网格。附加(网格)
210返回网格
ValueError:列数不一致:
这个
盖伊O
需要
他的O
自己的
秀
在O上
Discivery B公司
第一频道公司
! O