Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/311.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 摆脱熊猫重复的行列_Python_Pandas_Csv - Fatal编程技术网

Python 摆脱熊猫重复的行列

Python 摆脱熊猫重复的行列,python,pandas,csv,Python,Pandas,Csv,我从一个计数实验中得到了一些csv数据,在这个实验中,我得到了一个测量时间以及该时间和上一个测量时间之间的计数数。出于某种原因,每当我有计数时(有时我没有),该行就会重复与计数相同的次数。以下是一个基本示例: time counts t1 0 t2 1 t3 0 t4 3 t4 3 t4 3 t5 0 t4被重复3次,因为我有3个计数与之关联,这发生在任何数量的计数上(除了零,在这种情况下,行只出现一次)。在我的例子中有更多的专栏,但这两个才是最重要的。是否有快速方法删除这些冗余行并使每个计数

我从一个计数实验中得到了一些csv数据,在这个实验中,我得到了一个测量时间以及该时间和上一个测量时间之间的计数数。出于某种原因,每当我有计数时(有时我没有),该行就会重复与计数相同的次数。以下是一个基本示例:

time counts
t1 0
t2 1
t3 0
t4 3
t4 3
t4 3
t5 0
t4被重复3次,因为我有3个计数与之关联,这发生在任何数量的计数上(除了零,在这种情况下,行只出现一次)。在我的例子中有更多的专栏,但这两个才是最重要的。是否有快速方法删除这些冗余行并使每个计数只显示一次,即:

time counts
t1 0
t2 1
t3 0
t4 3
t5 0
谢谢大家!

使用拖放副本:

将numpy导入为np
作为pd进口熊猫
df=pd.DataFrame({'time':['t1','t2','t3','t4','t4','t4','t5'],
“计数”:[0,1,0,3,3,3,0]})
打印(df)
打印(df.drop_duplicates())
时间很重要
0 t1 0
1 t2 1
2 t30
3 t4 3
6 t5 0

删除重复项可以通过以下方式完成,只需使用特定列

df =  df.drop_duplicates('Column',keep='first')
这将删除重复项并仅保留第一个值

df =  df.drop_duplicates('time',keep='first')
您还可以按升序或降序排列数据,以获得更准确的结果

df = df.sort_values(by=['Counts'], ascending=[False],na_position='last')
df = df.drop_duplicates('time',keep='first')