Python 在带有标题的大数据帧中过滤掉NAN
我有大量的时间序列,其中一些在某些日期上有空格。我从XL表上读到了xlwings:Python 在带有标题的大数据帧中过滤掉NAN,python,pandas,Python,Pandas,我有大量的时间序列,其中一些在某些日期上有空格。我从XL表上读到了xlwings: Y0 = xw.Range('SomeRangeinXLsheet').options(pd.DataFrame, index=True , header=3).value 我正在尝试创建一个过滤器来运行这些系列的回归,所以我必须去掉无效日期。如果我: print(Y0.iloc[:,[i]]==Y0.iloc[:,[i]]) 对于我的列编号I,我得到一系列正确/错误,很好。 然后我被卡住了,找不到一种方法来
Y0 = xw.Range('SomeRangeinXLsheet').options(pd.DataFrame, index=True , header=3).value
我正在尝试创建一个过滤器来运行这些系列的回归,所以我必须去掉无效日期。如果我:
print(Y0.iloc[:,[i]]==Y0.iloc[:,[i]])
对于我的列编号I,我得到一系列正确/错误,很好。然后我被卡住了,找不到一种方法来过滤整个df,用该列的真/假,或者甚至只是提取干净的序列作为pd.序列。
我需要它们一个接一个地调整我的自变量的日期,使之分别与我的自变量的日期相适应。
谢谢您的帮助。我相信您希望使用我不确定是否理解您的问题,但是如果您希望检查特定列中的空值并删除这些行,您可以尝试此方法-
import pandas as pd
df = df[pd.notnull(df['column_name'])]
要删除NAN,df.dropna()。如果不起作用,可以尝试用占位符文本替换NAN,并尝试删除包含该占位符文本的行
df['column_name'] = df['column_name'].replace(np.nan, 'delete-it', regex = True)
df = df[df["column_name"] != 'delete-it']
希望这有帮助 我尝试过,但无法正确显示,我想,我有一些错误消息,例如:ValueError:error number of items passed 1,placement Insides 56OK,然后我建议在StackOverflow上逐个搜索您收到的每个错误消息,直到您解决了问题。