Python 大熊猫高效的列内操作
给定一个Python 大熊猫高效的列内操作,python,python-3.x,pandas,dataframe,vectorization,Python,Python 3.x,Pandas,Dataframe,Vectorization,给定一个pandas.DataFrame、一个列表和一个特殊值,我正在寻找一种优雅的方法: 在df的特定列中,每次遇到特殊值时,检查序列中的前一个值是否在列表中 如果是返回前面的值 如果否再返回一个值并检查它 一个有效的实施方案是: ser = [1, 2, 0, 2, 3, 1, 4, 7, 2] d = dict() relevant = [0,1] df = pd.DataFrame([list(range(len(ser))), ser]).transpose() for j in
pandas.DataFrame
、一个列表和一个特殊值,我正在寻找一种优雅的方法:
在df的特定列中,每次遇到特殊值时,检查序列中的前一个值是否在列表中
如果是返回前面的值
如果否再返回一个值并检查它
一个有效的实施方案是:
ser = [1, 2, 0, 2, 3, 1, 4, 7, 2]
d = dict()
relevant = [0,1]
df = pd.DataFrame([list(range(len(ser))), ser]).transpose()
for j in range(df.shape[0]):
if df.iloc[j,1]==2:
k=1
while True:
if df.iloc[j-k,1] in relevant:
d[j] = df.iloc[j-k,1]
break
else:
k+=1
这使得:
d
{1: 1, 3: 0, 8: 1}
我知道我可以使用这个函数,但是当我使用这个函数时,我有一个循环。我想知道什么是最好的方式来做到这一点优雅,如果可能的话速度没有循环。我相信你将需要至少一个循环,但你只需要一个。您所追求的是看到哨兵时看到的最后一个相关值。因此,这段代码跟踪扫描哨兵时最后看到的值 代码:
marker = 2
relevant = {0, 1}
ser = [1, 2, 0, 2, 3, 1, 4, 7, 2]
d = dict()
last_found = None
for i, val in enumerate(ser):
if val == marker:
if last_found is not None:
d[i] = last_found
elif val in relevant:
last_found = val
print(d)
{8: 1, 1: 1, 3: 0}
结果:
marker = 2
relevant = {0, 1}
ser = [1, 2, 0, 2, 3, 1, 4, 7, 2]
d = dict()
last_found = None
for i, val in enumerate(ser):
if val == marker:
if last_found is not None:
d[i] = last_found
elif val in relevant:
last_found = val
print(d)
{8: 1, 1: 1, 3: 0}