如何将Python中的分类变量转换为R中的因子变量？（网状）_Python_R_Categorical Data_Reticulate

如何将Python中的分类变量转换为R中的因子变量？（网状）

python r

如何将Python中的分类变量转换为R中的因子变量？（网状）,python,r,categorical-data,reticulate,Python,R,Categorical Data,Reticulate,我正在使用网状结构将python保存的.pkl转换为R数据帧。我看到分类python类型保存在R数据框中。我猜R不知道如何处理python分类变量。如何将这些转换为R中的因子变量 #Looking at the class of some of the variables in the R dataframe, I get class(df$variable) $variable [1] "pandas.core.arrays.categorical.Categorical" "panda

我正在使用网状结构将python保存的.pkl转换为R数据帧。我看到分类python类型保存在R数据框中。我猜R不知道如何处理python分类变量。如何将这些转换为R中的因子变量

#Looking at the class of some of the variables in the R dataframe, I get

class(df$variable)

$variable
[1] "pandas.core.arrays.categorical.Categorical" 
"pandas.core.arrays.base.ExtensionArray"    
[3] "pandas.core.base.PandasObject"              
"pandas.core.base.StringMixin"              
[5] "pandas.core.accessor.DirNamesMixin"         "python.builtin.object"      

#I get the right levels, but this doesn't seem to be R-friendly 

> table(levels(factor(as.character(df$varibale))))

[level 1, level 2, level 3, level 4, level 5, ..., NaN, NaN, NaN, NaN, 
NaN]\nLength: 464121\nCategories (6, object): [level 1 < level 2 < level 3 
< level 4 < level 5 < level 6]

查看R数据帧中一些变量的类，我得到类（df$变量） $variable [1] “pandas.core.array.categorical.categorical” “pandas.core.array.base.ExtensionArray” [3] “熊猫。核心。基础。熊猫对象” “熊猫。核心。基础。StringMixin” [5] “pandas.core.accessor.dirnamemixin”“python.builtin.object” #我得到了正确的水平，但这似乎不是R友好 >表（级别（因子（如字符（df$varibale））） [第1级、第2级、第3级、第4级、第5级，…，NaN，NaN，NaN，NaN， NaN]\n长度：464121\n类别（6，对象）：[级别1<级别2<级别3 <4级<5级<6级]