Python 3.x Pandas read_csv随机跳过带有特定条目的行_Python 3.x_Pandas_Dataframe

Python 3.x Pandas read_csv随机跳过带有特定条目的行

python-3.x pandas dataframe

Python 3.x Pandas read_csv随机跳过带有特定条目的行,python-3.x,pandas,dataframe,Python 3.x,Pandas,Dataframe,我有一个csv文件，我想跳过随机百分比的行，但仅限于其中一列有特定条目的行。例如，我可能有一个包含以下内容的csv，我想跳过所有apple条目的某个百分比： | a | b | c | d | e | |----|----|----|----|--------| 0| 9 | 1 | 2 | 3 | apple | 1| 8 | 4 | 5 | 6 | apple | 2| 7 | 7 | 8 | 9 | apple | 3| 6 | 10

我有一个csv文件，我想跳过随机百分比的行，但仅限于其中一列有特定条目的行。例如，我可能有一个包含以下内容的csv，我想跳过所有apple条目的某个百分比：

 | a  | b  | c  | d  | e      |
 |----|----|----|----|--------|
0| 9  | 1  | 2  | 3  | apple  |
1| 8  | 4  | 5  | 6  | apple  |
2| 7  | 7  | 8  | 9  | apple  |
3| 6  | 10 | 11 | 12 | orange |
4| 5  | 13 | 14 | 15 | orange |
5| 4  | 16 | 17 | 18 | orange |
6| 3  | 19 | 20 | 21 | orange |
7| 2  | 22 | 23 | 24 | banana |
8| 1  | 25 | 26 | 27 | banana |
9| 0  | 28 | 29 | 30 | banana |

我知道我可以跳过整个文件中的行，比如

 df = pd.read_csv('fruit.csv', skiprows = lambda i: i>0 and random.random() > probability_value)

我知道我也可以从数据框中选择apple条目

df2 = df.loc[df['e'] == 'apple']

但是，在导入csv并应用跳过行时，是否有一种简单的方法来选择这些条目，以使所有非“apple”条目不受跳过行的影响？

您可以按如下方式进行操作，但我更希望在稍后的阶段进行操作

df = pd.read_csv('fruit.csv').query("e != 'apple'")