Python连接列表
我最近阅读了关于python中VIF函数实现的文章,偶然发现了这篇文章 我无法理解在这条特定线路上正在进行的操作Python连接列表,python,python-3.x,pandas,list,Python,Python 3.x,Pandas,List,我最近阅读了关于python中VIF函数实现的文章,偶然发现了这篇文章 我无法理解在这条特定线路上正在进行的操作 features = "+".join(df.columns - ["annual_inc"]) 我知道当语句被激活时,输出会是什么 features = "+".join(df.columns) 有人能解释一下声明中-[annual_inc]的意义吗?我认为有使用过的旧熊猫代码,现在提出错误: df = pd.DataFrame(columns=['a','b','annual
features = "+".join(df.columns - ["annual_inc"])
我知道当语句被激活时,输出会是什么
features = "+".join(df.columns)
有人能解释一下声明中-[annual_inc]的意义吗?我认为有使用过的旧熊猫代码,现在提出错误:
df = pd.DataFrame(columns=['a','b','annual_inc'])
print (df.columns - ["annual_inc"])
TypeError:-:“str”和“str”的操作数类型不受支持
因此,用于从列名称中排除列表的值:
print(df.columns.difference(["annual_inc"]))
Index(['a', 'b'], dtype='object')
features = "+".join(df.columns.difference(["annual_inc"]))
print(features)
a+b
我认为使用了旧的pandas代码,现在出现错误:
df = pd.DataFrame(columns=['a','b','annual_inc'])
print (df.columns - ["annual_inc"])
TypeError:-:“str”和“str”的操作数类型不受支持
因此,用于从列名称中排除列表的值:
print(df.columns.difference(["annual_inc"]))
Index(['a', 'b'], dtype='object')
features = "+".join(df.columns.difference(["annual_inc"]))
print(features)
a+b
annual_inc是回归的目标变量,因此被排除在特征集之外。annual_inc是回归的目标变量,因此被排除在特征集之外。对于patsy.dmatrices,函数的第一个Arment是类似公式的,必须是类似于y~x1+x2的字符串。在features中,您正在创建一个字符串,其中所有列之间都用+连接,但目标变量是annual_inc。接下来,您必须将输入字符串创建为类似公式的字符串,即target~variable1+variable2+…,在“annual_inc”+features中
请参阅了解patsy.d矩阵。函数的第一个数组类似于公式,必须是类似于y~x1+x2的字符串。在features中,您正在创建一个字符串,其中所有列之间都用+连接,但目标变量是annual_inc。接下来,您必须将输入字符串创建为类似公式的字符串,即target~variable1+variable2+…,在“annual_inc”+features中
提及