Python 在神经网络中处理未定义的数据
我正在做一个神经网络项目,其中有一个功能,就是从用户上次活动到某个特定时间的时间。例如,假设有一个时间列表(3月15日、4月1日、4月24日等),我们希望找到每个用户在这些特定时间之前的最后一次活动与特定时间之间的间隔。更清楚地说,imagePython 在神经网络中处理未定义的数据,python,pandas,machine-learning,neural-network,jupyter-notebook,Python,Pandas,Machine Learning,Neural Network,Jupyter Notebook,我正在做一个神经网络项目,其中有一个功能,就是从用户上次活动到某个特定时间的时间。例如,假设有一个时间列表(3月15日、4月1日、4月24日等),我们希望找到每个用户在这些特定时间之前的最后一次活动与特定时间之间的间隔。更清楚地说,imageuser1在3月10日、3月13日和3月24日有一些动作,根据3月15日,他/她的值为2天(3月13日)。现在,如果用户在3月15日之前没有任何操作怎么办 现在由于一些算法,我加入了一些临时表,这导致了大量的NaN。如何告知网络不应考虑这些单元 edit1
user1
在3月10日、3月13日和3月24日有一些动作,根据3月15日,他/她的值为2天(3月13日)。现在,如果用户在3月15日之前没有任何操作怎么办
现在由于一些算法,我加入了一些临时表,这导致了大量的NaN
。如何告知网络不应考虑这些单元
edit1 填充单元格的代码如下所示:
for aciton_time in all_aciton_times:
interval_tmp = actions_df.loc[(actions_df['when'] < aciton_time)].drop_duplicates(subset="device_id", keep='last')
interval_tmp['aciton_' + str(aciton_time)] = interval_tmp['when'].apply(lambda x: aciton_time - x)
del interval_tmp['when']
interval = interval.merge(interval_tmp, on="device_id", how="outer")
previous_aciton_time = aciton_time
对于所有aciton\u时间中的aciton\u时间:
间隔时间=actions\u df.loc[(actions\u df['when']
结果是这样的:
谢谢如果您有一个大数据集,您可以删除任何具有NaN值的行您可以向我们展示与问题相关的代码吗?请在线查看更新后搜索,了解如何处理丢失的数据。基本上,当数据丢失时,必须以这样或那样的方式做出一些妥协。删除行、插补值等。是的,数据集很大,但我不能删除这些行,因为我的数据集严重不平衡(99%以上的数据被标记为0),这些行都与1相关,如果我删除它们,我会使数据集更加不平衡