如何将Python中的分类变量转换为R中的因子变量?(网状)
我正在使用网状结构将python保存的.pkl转换为R数据帧。我看到分类python类型保存在R数据框中。我猜R不知道如何处理python分类变量。如何将这些转换为R中的因子变量如何将Python中的分类变量转换为R中的因子变量?(网状),python,r,categorical-data,reticulate,Python,R,Categorical Data,Reticulate,我正在使用网状结构将python保存的.pkl转换为R数据帧。我看到分类python类型保存在R数据框中。我猜R不知道如何处理python分类变量。如何将这些转换为R中的因子变量 #Looking at the class of some of the variables in the R dataframe, I get class(df$variable) $variable [1] "pandas.core.arrays.categorical.Categorical" "panda
#Looking at the class of some of the variables in the R dataframe, I get
class(df$variable)
$variable
[1] "pandas.core.arrays.categorical.Categorical"
"pandas.core.arrays.base.ExtensionArray"
[3] "pandas.core.base.PandasObject"
"pandas.core.base.StringMixin"
[5] "pandas.core.accessor.DirNamesMixin" "python.builtin.object"
#I get the right levels, but this doesn't seem to be R-friendly
> table(levels(factor(as.character(df$varibale))))
[level 1, level 2, level 3, level 4, level 5, ..., NaN, NaN, NaN, NaN,
NaN]\nLength: 464121\nCategories (6, object): [level 1 < level 2 < level 3
< level 4 < level 5 < level 6]
查看R数据帧中一些变量的类,我得到
类(df$变量)
$variable
[1] “pandas.core.array.categorical.categorical”
“pandas.core.array.base.ExtensionArray”
[3] “熊猫。核心。基础。熊猫对象”
“熊猫。核心。基础。StringMixin”
[5] “pandas.core.accessor.dirnamemixin”“python.builtin.object”
#我得到了正确的水平,但这似乎不是R友好
>表(级别(因子(如字符(df$varibale)))
[第1级、第2级、第3级、第4级、第5级,…,NaN,NaN,NaN,NaN,
NaN]\n长度:464121\n类别(6,对象):[级别1<级别2<级别3
<4级<5级<6级]