Python 仅在特定列上使用功能工具
我正在尝试使用功能工具,仅使用泰坦尼克号数据集的一些指定列来生成一些新功能。在我的例子中,我想对Age、Pclass和log10splitfare进行“add\u numeric”和“multiply\u numeric”转换。我尽我所知遵循了给定的语法,但没有任何效果。下面的代码不会出错,但不会生成任何附加列。我还将此stackoverflow用作参考Python 仅在特定列上使用功能工具,python,featuretools,Python,Featuretools,我正在尝试使用功能工具,仅使用泰坦尼克号数据集的一些指定列来生成一些新功能。在我的例子中,我想对Age、Pclass和log10splitfare进行“add\u numeric”和“multiply\u numeric”转换。我尽我所知遵循了给定的语法,但没有任何效果。下面的代码不会出错,但不会生成任何附加列。我还将此stackoverflow用作参考 es = ft.EntitySet(id = 'Titanic') es.entity_from_dataframe(entity_id =
es = ft.EntitySet(id = 'Titanic')
es.entity_from_dataframe(entity_id = 'data', dataframe = ftdataset_cleaned,
make_index = False, index = 'index')
# Run deep feature synthesis with transformation primitives
feature_matrix, feature_defs = ft.dfs(entityset = es, target_entity = 'data',
trans_primitives = ['add_numeric', 'multiply_numeric'],
primitive_options= {('add_numeric', 'multiply_numeric'):{"include_entities": ['Age','PClass','log10SplitFare']}}
)
可以使用include_variables选项指定实体中用于特定原语的列
特征矩阵,特征定义=ft.dfs
entityset=es,
目标实体=“数据”,
trans_原语=['add_numeric'、'multiply_numeric'],
基本选项={
“加上数字”、“乘上数字”:{
'include_variables':{'data':['Age','PClass','log10SplitFare']}
更深入地介绍了控制原语应用方式的不同方法。您可以使用include_variables选项指定实体中用于特定原语的列
特征矩阵,特征定义=ft.dfs
entityset=es,
目标实体=“数据”,
trans_原语=['add_numeric'、'multiply_numeric'],
基本选项={
“加上数字”、“乘上数字”:{
'include_variables':{'data':['Age','PClass','log10SplitFare']}
更深入地介绍了控制如何应用基本体的不同方法。如果基本体是定制的,则此方法不起作用如果基本体是定制的,则此方法不起作用