Machine learning 如何处理机器学习中有偏见的特征(日期)

Machine learning 如何处理机器学习中有偏见的特征(日期),machine-learning,feature-selection,Machine Learning,Feature Selection,我有一个模型可以预测马的寿命。该数据集包含1980年至2019年的样本,其中一个特征名为出生日期,标有每匹马的寿命(以年为单位)。问题是知道一匹马通常活20到30年,如果我们从1980年到1990年看,我们有马的完整列表和它们的寿命,但从2000年到2019年,我们只看到在这段时间内出生和死亡的马的样本,而没有看到目前活着的马,因此,birh_日期是一个有偏见的特征 有没有一种方法可以使用“birh_date”功能而不必担心有偏差的数据,或者使用某种技术来最小化他对最终预测的影响?就这一问题向总

我有一个模型可以预测马的寿命。该数据集包含1980年至2019年的样本,其中一个特征名为出生日期,标有每匹马的寿命(以年为单位)。问题是知道一匹马通常活20到30年,如果我们从1980年到1990年看,我们有马的完整列表和它们的寿命,但从2000年到2019年,我们只看到在这段时间内出生和死亡的马的样本,而没有看到目前活着的马,因此,birh_日期是一个有偏见的特征


有没有一种方法可以使用“birh_date”功能而不必担心有偏差的数据,或者使用某种技术来最小化他对最终预测的影响?

就这一问题向总部寻求帮助可能更合适一些。就这一问题向总部寻求帮助可能更合适一些。