如何在python的rpy2中从R数据帧中选择列?

如何在python的rpy2中从R数据帧中选择列?,python,r,dataframe,rpy2,Python,R,Dataframe,Rpy2,我在python的rpy2中有一个数据帧,我想从中提取列。这个R代码的rpy2等价物是什么 df[,c(“可乐”、“可乐”)] 此操作用于获取第一列: mydf.rx(1) 但是我如何才能拉一组列,例如第1列、第3列和第5列 mydf.rx([1,3,5]) 不起作用。也没有: mydf.rx(rpy2.robjects.r.c([1,3,5]))我想答案是: # cols to select c = rpy2.robjects.IntVector((1,3)) # selection from

我在python的rpy2中有一个数据帧,我想从中提取列。这个R代码的rpy2等价物是什么

df[,c(“可乐”、“可乐”)]

此操作用于获取第一列:

mydf.rx(1)

但是我如何才能拉一组列,例如第1列、第3列和第5列

mydf.rx([1,3,5])

不起作用。也没有:

mydf.rx(rpy2.robjects.r.c([1,3,5]))
我想答案是:

# cols to select
c = rpy2.robjects.IntVector((1,3))
# selection from df
mydf.rx(True, c)

或者,您可以将R数据帧传递到Python数据帧中,并将生成的1、3、5列子集:

#!/usr/bin/python
import rpy2
import rpy2.robjects as ro
import pandas as pd
import pandas.rpy.common as com

# SOURCE R SCRIPT INSIDE PYTHON 
ro.r.source('C:\\Path\To\R script.R') 

# DEFINE PYTHON DF AS R DF
pydf = com.load_data('rdf')
cols = pydf[[1,3,5]]

我发现最好的方法就是做这件简单的事:

from rpy2.robjects.packages import importr
from rpy2.robjects import pandas2ri
import rpy2.robjects as robjects

dataframe = robjects.r('data.frame')
df_rpy2 = dataframe([1,2,],[5,6])
df_pd = pd.DataFrame({'A': [1,2], 'B': [5,6]})

base = importr('base') #Creates an instance of R's base package 
pandas2ri.activate() #Converts any pandas dataframe to R equivalent

base.colnames(df_pd) #Finds the column names of the dataframe df_pd 
base.colnames(df_rpy2) #Finds the column names of the dataframe df_rpy2
输出为:

R object with classes: ('character',) mapped to:
<StrVector - Python:0x7fa3504d3048 / R:0x10f65ac0>
['X1L', 'X2L', 'X5L', 'X6L']

R object with classes: ('character',) mapped to:
<StrVector - Python:0x7fa352493548 / R:0x103b6e40>
['A', 'B']
R对象,其类:('character',)映射到:
['X1L'、'X2L'、'X5L'、'X6L']
类('character',)映射到以下对象的R对象:
['A','B']
这适用于使用pandas和rpy2创建的数据帧。希望这有帮助