Python 我们是否可以通过创建对数转换来转换连续目标变量,以获得正态分布?

Python 我们是否可以通过创建对数转换来转换连续目标变量,以获得正态分布?,python,machine-learning,data-science,Python,Machine Learning,Data Science,下面的代码给出了目标变量Item\u Outlet\u Sales before transformation和Item\u Outlet\u Sales\u log,该变量已被转换 #treat extreme values in Item_Outlet_Sales train['Item_Outlet_Sales_log'] = np.log(train.Item_Outlet_Sales) test['Item_Outlet_Sales_log'] = np.log(test.Item_O

下面的代码给出了目标变量Item\u Outlet\u Sales before transformation和Item\u Outlet\u Sales\u log,该变量已被转换

#treat extreme values in Item_Outlet_Sales
train['Item_Outlet_Sales_log'] = np.log(train.Item_Outlet_Sales)
test['Item_Outlet_Sales_log'] = np.log(test.Item_Outlet_Sales)

plt.figure(1)
plt.subplot(121)
sns.distplot(train.Item_Outlet_Sales)
sns.distplot(test.Item_Outlet_Sales);
plt.subplot(122)
sns.distplot(train.Item_Outlet_Sales_log)
sns.distplot(test.Item_Outlet_Sales_log);

然后使用新的目标变量(Outlet\u Item\u Sales):

谢谢你的帮助

#creating dummies for the training dataset
X = train.drop('Item_Outlet_Sales', 1) #drop the log target column
y = train.Item_Outlet_Sales_log

X = pd.get_dummies(X)
train = pd.get_dummies(temp_train)