Python 3.x 功能工具:在新数据上使用在列车数据中计算的功能

Python 3.x 功能工具:在新数据上使用在列车数据中计算的功能,python-3.x,feature-extraction,feature-engineering,featuretools,Python 3.x,Feature Extraction,Feature Engineering,Featuretools,我想知道如何使用在火车时刻开发的特性来预测新数据。所涉及的数据集是来自的约会取消数据集 考虑功能位置。百分比为真(不显示):给定位置过去约会取消的百分比。假设我有新的输入测试数据,其位置与我已经知道这些值的列车数据相同。如何在测试数据中使用此功能?当然,我可以将测试数据合并到列车数据中,并使用featuretools.dfs()重新计算所有特征,但这很耗时 有更简单的方法吗?是的,不需要将测试数据合并到列车数据中。可以对传入的测试数据重用特征定义。例如,当您对列车数据使用DFS时,包含位置的特征

我想知道如何使用在火车时刻开发的特性来预测新数据。所涉及的数据集是来自的约会取消数据集

考虑功能
位置。百分比为真(不显示)
:给定位置过去约会取消的百分比。假设我有新的输入测试数据,其位置与我已经知道这些值的列车数据相同。如何在测试数据中使用此功能?当然,我可以将测试数据合并到列车数据中,并使用
featuretools.dfs()
重新计算所有特征,但这很耗时


有更简单的方法吗?

是的,不需要将测试数据合并到列车数据中。可以对传入的测试数据重用特征定义。例如,当您对列车数据使用DFS时,包含
位置的特征定义将与特征矩阵一起返回

fm,功能=ft.dfs(
entityset=es_列车,
目标(单位)任命",,
...
)
在测试数据上,可以创建实体集并重用定义来计算特征

fm=ft.计算特征矩阵(
特征=特征,
entityset=es_测试,
...
)

如果有帮助,请告诉我。

是的,不需要将测试数据合并到列车数据。可以对传入的测试数据重用特征定义。例如,当您对列车数据使用DFS时,包含
位置的特征定义将与特征矩阵一起返回

fm,功能=ft.dfs(
entityset=es_列车,
目标(单位)任命",,
...
)
在测试数据上,可以创建实体集并重用定义来计算特征

fm=ft.计算特征矩阵(
特征=特征,
entityset=es_测试,
...
)

如果这有帮助,请告诉我。

您能解释一下它是如何工作的吗。如果我是对的,
特征
变量是特征定义字符串的列表。第二个函数如何知道在列车运行时计算的特征值?特征定义源自
FeatureBase
对象,该对象可以使用重构特征所需的元数据进行序列化/反序列化。通过使用特征定义对象,第二个函数可以重构特征并将其应用于新的实体集。有更多关于使用功能定义的信息。您能解释一下它是如何工作的吗。如果我是对的,
特征
变量是特征定义字符串的列表。第二个函数如何知道在列车运行时计算的特征值?特征定义源自
FeatureBase
对象,该对象可以使用重构特征所需的元数据进行序列化/反序列化。通过使用特征定义对象,第二个函数可以重构特征并将其应用于新的实体集。包含有关使用要素定义的详细信息。