Python 如何解决数据帧中a必须大于0的问题?
我的代码是:Python 如何解决数据帧中a必须大于0的问题?,python,Python,我的代码是: df.query('level == {0}'.format(i)).sample(nsamples).image.apply( lambda v: (os.path.join(datadir, v) + '.jpeg', i)).values.tolist() 我遇到的错误: df.query('level == {0}'.format(i)).sample(nsamples).image.apply( lambda v: (os.path.join(datadir, v) +
df.query('level == {0}'.format(i)).sample(nsamples).image.apply( lambda v: (os.path.join(datadir, v) + '.jpeg', i)).values.tolist()
我遇到的错误:
df.query('level == {0}'.format(i)).sample(nsamples).image.apply( lambda v: (os.path.join(datadir, v) + '.jpeg', i)).values.tolist()
ValueError:“a”必须大于0,除非未采集任何样本
您的查询是否返回空数据帧?“a”必须大于0
错误被抛出,因为一些数据帧是空的。您可以在处理之前检查样本
的长度
samp=np.random.choice(n_docs,samp_size)
和n_docs
结果是0,因为n_docs=len(docs)
,而docs是一个空序列“shape(0,)”。它是空的,因为我已经减少了我的数据集,以至于在我选择的几千行中,在任何文档中都没有“摘要”,尽管预处理(my_SERIES,samp_size=samp_size)希望有一个非空的序列作为my_SERIES,也就是说,该序列中至少有一个“摘要”。