Python 如何使用pandas从Excel文件中删除重复项

Python 如何使用pandas从Excel文件中删除重复项,python,pandas,Python,Pandas,我正在处理excel工作表: animal name age dog puppy 1 dog doggy 2 dog snooppy 3 cat pussy 1 pig piggy 1 pig cutty 2 rabit robby 1 rabbit bunny 2 在这里,我应该检查动物年龄是否为1,应该删除该行并打印下一行,如果没有重复项,则删除重复项,应该打印该行并在其他excel工作表中打印此输出 有人能帮我摆脱这

我正在处理excel工作表:

animal name    age
dog    puppy   1
dog    doggy   2
dog    snooppy 3
cat    pussy   1
pig    piggy   1
pig    cutty   2
rabit  robby   1
rabbit bunny   2
在这里,我应该检查动物年龄是否为1,应该删除该行并打印下一行,如果没有重复项,则删除重复项,应该打印该行并在其他excel工作表中打印此输出

有人能帮我摆脱这一切吗

import 
imatplotlib.pyplot as plt
import pandas as pd

data = pd.read_excel(r"C:\Users\c_ssaiva\Desktop\sampladata.xlsx")
for index,row in data.iterrows():
print(index,row['animal'],row['name'],row['age'])
for j,row in data.iterrows():

 if a[i] == a[j]:
 if a[i] == 1
 print a[j]
 else:
 print (a[i])
 df = data
 df.to_excel(r"C:\Users\c_ssaiva\Desktop\selcol.xlsx")          

嗨,Shrvya。熊猫真是太棒了,它可以做到你所要求的一切,而无需循环:) 你可以在一行中完成

df = data[data['age'] != 1].drop_duplicates()
我们制作了一个新的df,用于删除所有“年龄”!=1,然后我们删除重复项:)


我不确定打印值的目的是什么。为什么要在屏幕上打印值?

您期望的输出是什么?是否有特殊原因不能使用
df。删除重复项?要打印下一行的年龄!=1,如果存在重复项如果没有重复项,则将输出打印到aexcelsheetoutput检查第1行动物是否=第2行动物,然后检查第1行年龄是否=1,然后打印第2行。如果第1行动物!=1,然后打印第1行,但我需要的动物的年龄=1时,没有重复SAH!age_one=data[(data['age']==1)和(~data.duplicated())]如果age=1没有重复项,我需要将该动物和其他具有重复项的动物移除,其中age=1并打印下一个年龄。在上面我使用了两个条件,有人问动物必须是1岁并且不应该重复。我不确定你想要什么,但是如果你看上面的答案,你可以建立自己的条件;)