Pandas 我们可以基于聚合标准对熊猫数据帧进行采样吗 a=df[df.contribution

Pandas 我们可以基于聚合标准对熊猫数据帧进行采样吗 a=df[df.contribution,pandas,random,Pandas,Random,您的想法是希望示例中包含的记录更多而不是更少。 不幸的是使用循环 a = df.sample(sum(df['contribution'])<100) 将熊猫作为pd导入 将numpy作为np导入 df=pd.DataFrame(np.random.randint(1,35,(15,1)),columns=['contribution'] 对于反向(范围(len(df))中的i: 如果df['contribution'].sample(i).sum()小于100: 打印df 打破 您可以

您的想法是希望示例中包含的记录更多而不是更少。 不幸的是使用循环

a = df.sample(sum(df['contribution'])<100)
将熊猫作为pd导入
将numpy作为np导入
df=pd.DataFrame(np.random.randint(1,35,(15,1)),columns=['contribution']
对于反向(范围(len(df))中的i:
如果df['contribution'].sample(i).sum()小于100:
打印df
打破

您可以发布数据帧的小样本吗?您是否需要在
贡献
行增加到100的地方采集样本?是的,您是正确的,“贡献”的总和不应超过100
a = df.sample(sum(df['contribution'])<100)
import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.randint(1,35,(15,1)),columns = ['contribution'])

for i in reversed(range(len(df))):
    if df['contribution'].sample(i).sum() < 100:
        print df
        break