Python 如何使用pandas从Excel文件中删除重复项_Python_Pandas

Python 如何使用pandas从Excel文件中删除重复项

python pandas

Python 如何使用pandas从Excel文件中删除重复项,python,pandas,Python,Pandas,我正在处理excel工作表： animal name age dog puppy 1 dog doggy 2 dog snooppy 3 cat pussy 1 pig piggy 1 pig cutty 2 rabit robby 1 rabbit bunny 2 在这里，我应该检查动物年龄是否为1，应该删除该行并打印下一行，如果没有重复项，则删除重复项，应该打印该行并在其他excel工作表中打印此输出有人能帮我摆脱这

我正在处理excel工作表：

animal name    age
dog    puppy   1
dog    doggy   2
dog    snooppy 3
cat    pussy   1
pig    piggy   1
pig    cutty   2
rabit  robby   1
rabbit bunny   2

在这里，我应该检查动物年龄是否为1，应该删除该行并打印下一行，如果没有重复项，则删除重复项，应该打印该行并在其他excel工作表中打印此输出

有人能帮我摆脱这一切吗

import 
imatplotlib.pyplot as plt
import pandas as pd

data = pd.read_excel(r"C:\Users\c_ssaiva\Desktop\sampladata.xlsx")
for index,row in data.iterrows():
print(index,row['animal'],row['name'],row['age'])
for j,row in data.iterrows():

 if a[i] == a[j]:
 if a[i] == 1
 print a[j]
 else:
 print (a[i])
 df = data
 df.to_excel(r"C:\Users\c_ssaiva\Desktop\selcol.xlsx")

嗨，Shrvya。熊猫真是太棒了，它可以做到你所要求的一切，而无需循环：）你可以在一行中完成

df = data[data['age'] != 1].drop_duplicates()

我们制作了一个新的df，用于删除所有“年龄”！=1，然后我们删除重复项：）

我不确定打印值的目的是什么。为什么要在屏幕上打印值？

您期望的输出是什么？是否有特殊原因不能使用

df。删除重复项？要打印下一行的年龄！=1，如果存在重复项如果没有重复项，则将输出打印到aexcelsheetoutput检查第1行动物是否=第2行动物，然后检查第1行年龄是否=1，然后打印第2行。如果第1行动物！=1，然后打印第1行，但我需要的动物的年龄=1时，没有重复SAH！age_one=data[（data['age']==1）和（~data.duplicated（））]如果age=1没有重复项，我需要将该动物和其他具有重复项的动物移除，其中age=1并打印下一个年龄。在上面我使用了两个条件，有人问动物必须是1岁并且不应该重复。我不确定你想要什么，但是如果你看上面的答案，你可以建立自己的条件；）