Pandas 我们可以基于聚合标准对熊猫数据帧进行采样吗 a=df[df.contribution
您的想法是希望示例中包含的记录更多而不是更少。 不幸的是使用循环Pandas 我们可以基于聚合标准对熊猫数据帧进行采样吗 a=df[df.contribution,pandas,random,Pandas,Random,您的想法是希望示例中包含的记录更多而不是更少。 不幸的是使用循环 a = df.sample(sum(df['contribution'])<100) 将熊猫作为pd导入 将numpy作为np导入 df=pd.DataFrame(np.random.randint(1,35,(15,1)),columns=['contribution'] 对于反向(范围(len(df))中的i: 如果df['contribution'].sample(i).sum()小于100: 打印df 打破 您可以
a = df.sample(sum(df['contribution'])<100)
将熊猫作为pd导入
将numpy作为np导入
df=pd.DataFrame(np.random.randint(1,35,(15,1)),columns=['contribution']
对于反向(范围(len(df))中的i:
如果df['contribution'].sample(i).sum()小于100:
打印df
打破
您可以发布数据帧的小样本吗?您是否需要在贡献
行增加到100的地方采集样本?是的,您是正确的,“贡献”的总和不应超过100
a = df.sample(sum(df['contribution'])<100)
import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.randint(1,35,(15,1)),columns = ['contribution'])
for i in reversed(range(len(df))):
if df['contribution'].sample(i).sum() < 100:
print df
break