如何在python中对多个分类特性进行一次热编码,而不被困在伪变量中
在进行一次热编码时,我们陷入了虚拟变量陷阱,为了避免这种情况,我们放弃了其中一个分类特征 如果您正在为多个分类功能执行OHE,该怎么办如何在python中对多个分类特性进行一次热编码,而不被困在伪变量中,python,machine-learning,scikit-learn,classification,Python,Machine Learning,Scikit Learn,Classification,在进行一次热编码时,我们陷入了虚拟变量陷阱,为了避免这种情况,我们放弃了其中一个分类特征 如果您正在为多个分类功能执行OHE,该怎么办 有什么直观的方法可以做到这一点吗?也许pandas.get\u dummies会很有帮助 您只需执行以下操作: import pandas as pd dummies = pd.get_dummies(X_data, columns=[col1, col2], drop_first=True) 这对你有帮助吗? 在此处找到文档:谢谢,不用担心,如果这是正确的,
有什么直观的方法可以做到这一点吗?也许
pandas.get\u dummies
会很有帮助
您只需执行以下操作:
import pandas as pd
dummies = pd.get_dummies(X_data, columns=[col1, col2], drop_first=True)
这对你有帮助吗?
在此处找到文档:谢谢,不用担心,如果这是正确的,您可以验证答案,以便与您有相同问题的人能够看穿它