Python “随机”;int是不可下标的;行为
我正在读取一个有效的JSON文件(嵌套5层),然后向其中添加一些数据,然后尝试使用这些数据进行一些计算 我得到的Python “随机”;int是不可下标的;行为,python,json,exception,dictionary,casting,Python,Json,Exception,Dictionary,Casting,我正在读取一个有效的JSON文件(嵌套5层),然后向其中添加一些数据,然后尝试使用这些数据进行一些计算 我得到的int是不可下标的错误是随机的。我不能把我的头绕在它周围。强制转换到str()没有帮助,使用pprint打印并不能缓解它,在输入时强制转换到int()也没有帮助。我绝望地失去了选择 主要功能 with open(rNgram_file, 'r', encoding='utf-8') as ngram_file: data = json.load(ngram_file)
int是不可下标的
错误是随机的。我不能把我的头绕在它周围。强制转换到str()
没有帮助,使用pprint
打印并不能缓解它,在输入时强制转换到int()
也没有帮助。我绝望地失去了选择
主要功能
with open(rNgram_file, 'r', encoding='utf-8') as ngram_file:
data = json.load(ngram_file)
data = rank_items(data)
data = probability_items(data)
排名项目(数据)
所有值都在5嵌套级别进行计数,并在树中向上添加。我在输入中添加了int()
cast作为一种可能的解决方案,但这没有帮助。获取x_grams[''u rank']
概率项目(数据)
这就是错误发生的地方。似乎是随机的,它会抱怨int不可下标
在打印或分配x_-rank
或x-grams['rank]
时,即使使用type()
对它们进行评估(如果它起作用,则表示
)
我在下面用注释标出了最常见的几行。
奇怪的是,第2行和第3行从未引发异常
for ngram, one_grams in data.items():
ngram_rank = int(one_grams['_rank']) # never gives an error
print("NgramRank: ", str(ngram_rank)) # never gives an error
if ngram != '_rank':
for one_gram, two_grams in one_grams.items():
pprint(type(two_grams['_rank'])) # common error point
one_gram_rank = str(two_grams['_rank']) # never reaches this
if one_gram != '_rank':
for two_gram, three_grams in two_grams.items():
pprint(type(three_grams['_rank'])) # common error point
pprint(str(three_grams['_rank'])) # never reaches this
two_gram_rank = str(three_grams['_rank'])
[..]
one_gram_prob = int(one_gram_rank) / int(ngram_rank)
two_grams['_prob'] = one_gram_prob
ngram_prob = int(ngram_rank) / int(ngram_rank)
one_grams['_prob'] = ngram_prob
以randowm的方式,在上面的公共错误点上抛出异常。由于这些例外情况,无法达到下面的行。但如果删除常见错误点,下面的行将成为错误点。
有时,它会在内部for循环中进行一次完整的运行,在计算时打印
,直到在异常时停止
我不知道发生了什么,我甚至不明白当我使用Type()
因为这是一个奇怪的问题,而且我显然犯了一个奇怪的错误,所以我将所有代码放在这里的要点中:
希望有人能帮忙
回溯详细信息
['Traceback (most recent call last):\n', ' File "Ngram_ranking.py", line 121, in probability_items\n pprint(type(four_grams[\'_rank\']))\n', "TypeError: 'int' object is not subscriptable\n"]
*** extract_tb:
[('Ngram_ranking.py', 121, 'probability_items', "pprint(type(four_grams['_rank']))")]
*** format_tb:
[' File "Ngram_ranking.py", line 121, in probability_items\n pprint(type(four_grams[\'_rank\']))\n']
*** tb_lineno: 121
Exception in on line 121: pprint(type(four_grams['_rank'])): 'int' object is not subscriptable
对第115行的回溯
['Traceback (most recent call last):\n', ' File "Ngram_ranking.py", line 115, in probability_items\n pprint(type(three_grams[\'_rank\']))\n', "TypeError: 'int' object is not subscriptable\n"]
*** extract_tb:
[('Ngram_ranking.py', 115, 'probability_items', "pprint(type(three_grams['_rank']))")]
*** format_tb:
[' File "Ngram_ranking.py", line 115, in probability_items\n pprint(type(three_grams[\'_rank\']))\n']
*** tb_lineno: 115
Exception in on line 115: pprint(type(three_grams['_rank'])): 'int' object is not subscriptable
p概率项(数据)顶部的点(数据)
问题是您有一个多级嵌套字典,尽管嵌套有些不同,但您为所有三个级别复制了相同的代码 我就从你的字典里拿一部分
{
'aesthetic':
{
'_rank': 290,
'feeling':
{
'_rank': 10,
'the':
{
'_rank': 10,
'feeling':
{
'_rank': 10,
'of': 10
}
}
},
}
}
您的顶级词典是统一的,因为值(对于键美学
)始终是一个词典。但较低级别也有int
作为其某些值
所以当你这样做的时候
for ngram, one_grams in data.items():
你有ngram=美学
和one_grams={the dictionary}
int(one_grams['_rank'])
将始终有效(因为值字典中有元素\u rank
。因此您永远不会在这里遇到错误
现在我们进入下一步
one_gram, two_grams in one_grams.items()
运行.items()
forone\u grams
字典
(one_gram,two_grams) = [('_rank', 290), ('feeling', {'_rank': 10, 'the': {'_rank': 10, 'feeling': {'_rank': 10, 'of': 10}}})]
注意two_grams
对于第一个条目是int
,对于第二个条目是dict
。因为您在执行
two_grams['_rank']
您遇到了错误(它告诉您在预期的dict
时遇到了int
)。同样的问题也发生在内部循环中
由于字典没有顺序,items()可以按任何顺序返回。因此,\u rank
可能是第一个元素,也可能在其他字典元素的下面。在这种情况下,您会进入内部for循环,并在那里遇到相同的问题
您可以在迭代时忽略\u rank
键
for one_gram,two_grams one_grams.items():
if one_gram=='_rank':
continue
在所有的循环中。你能给出完整的stacktrace吗?@thefourtheye编辑了这篇文章,现在有了回溯(借用了tb代码:)建议:每次你做
pprint(键入(x_grams[''])
你都要在它前面加pprint(键入(x_grams))
在您尝试下标之前,只需验证x_grams
是什么类型。似乎在代码中的某个位置,您将int分配给x_grams
值之一,您只想分配dict,但不清楚在哪里。因此,如果type(x_grams),请执行if type(x_grams)!=dict:
在尝试下标之前,先将x_grams下标。或仅将其下标为pprint(数据)
在你做任何事情之前,你可以检查整个结构,看看错误的ints在哪里。@purepilture我想我已经用if ngram!=''u rank':
说明了这一点,但显然没有。非常感谢!@purepilture这样看:在循环中的某个点对于一克,一克中有两克。items():
你会发现one'u gram
是“u rank”
而two'u gram
是一个int。但是你在检查是否是int之前调用pprint(键入(two'u gram['u rank'))
。
two_grams['_rank']
for one_gram,two_grams one_grams.items():
if one_gram=='_rank':
continue