Python 有没有最佳的解决方案?
我有一个大数据,包含:ID、年份、计划。如果一个特定的程序(例如a)比另一个程序(例如B)具有更多的年值(例如:2019>2018),我想过滤掉ID。我有一个解决方案,但它涉及一个循环。我想知道还有没有别的办法。 我的代码:Python 有没有最佳的解决方案?,python,Python,我有一个大数据,包含:ID、年份、计划。如果一个特定的程序(例如a)比另一个程序(例如B)具有更多的年值(例如:2019>2018),我想过滤掉ID。我有一个解决方案,但它涉及一个循环。我想知道还有没有别的办法。 我的代码: unique = list(set(finalAD['ID'])) IDFiltered = [] for i in unique: data = finalAD[finalAD['ID'] == i] AD1 = data[data['Program'].
unique = list(set(finalAD['ID']))
IDFiltered = []
for i in unique:
data = finalAD[finalAD['ID'] == i]
AD1 = data[data['Program'].str.match('AD')]
ind = list(AD1.index.values)
AD2 = data.drop(ind)
date1 = AD1['Year'].max()
date2 = AD2['Year'].min()
if(date2 > date1):
IDFiltered.append(i)
newData = finalAD[finalAD['ID'].isin(IDFiltered)]
newData.reset_index(drop = True, inplace = True)
newData.head()
非常擅长这类事情…像hiro说的那样传递给pandas是一个很好的解决方案和兼容的解决方案,或者您可以根据结果尝试使用线程运行返回到列表
IDFiltered
,通过并行执行来加速循环在这类事情上非常擅长…像hiro说的那样传递给pandas是一个很好的解决方案,并且compatible One或由于结果返回到列表IDFiltered
,您可以尝试使用线程运行,以通过并行执行加快循环速度