将R转换为Python管道-筛选、选择和排序
我正在清理R中的一个数据集,并试图在Python中找到我下面的清理过程的等价物将R转换为Python管道-筛选、选择和排序,python,pandas,Python,Pandas,我正在清理R中的一个数据集,并试图在Python中找到我下面的清理过程的等价物 df = dataframe %>% filter(grepl('abc', Sheet1)) %>% select(product) %>% arrange(nchar(product)) 我知道在熊猫中进行过滤时,我可以执行类似于df[df['var']!='string']的操作,但是如果我希望包含特定的字符串值并在排序之前选择相关列,我该如何操作呢 任何见解都将不胜感激
df = dataframe %>%
filter(grepl('abc', Sheet1)) %>%
select(product) %>%
arrange(nchar(product))
我知道在熊猫中进行过滤时,我可以执行类似于df[df['var']!='string']的操作,但是如果我希望包含特定的字符串值并在排序之前选择相关列,我该如何操作呢
任何见解都将不胜感激 如果您可以发布数据会有所帮助,但大致如下:
> df %>% filter(grepl('abc', Sheet1)) %>%
df.Sheet1.str.contains('abc')
…仅以['product']下标
> arrange(nchar(product))
df.sort_索引(level=df.product.apply(len))使用:
df = pd.DataFrame({'Sheet1':['abc f','as abc','ss','abc','abcd'],
'product':['aa','sss','aaa','s','ddddd'],
'val':[7,8,9,4,2]})
print (df)
Sheet1 product val
0 abc f aa 7
1 as abc sss 8
2 ss aaa 9
3 abc s 4
4 abcd ddddd 2
你能添加一些数据样本和预期输出吗?dt=dt0%>%filter(grepl(‘伊利诺伊州’)%%>%select(人口,犯罪率)%%>%arrange(nchar(人口))所以我基本上是在尝试筛选非伊利诺伊州,然后选择城市的人口和犯罪率,同时按城市人口进行排序。它在R中对我有效,但我无法获得在Python中运行的正确代码。谢谢!我会试试这个。@CatherineZhang-我添加了一些示例数据,请稍等。谢谢!我认为'select'也可以是df[['人口','犯罪率]]。
df = pd.DataFrame({'Sheet1':['abc f','as abc','ss','abc','abcd'],
'product':['aa','sss','aaa','s','ddddd'],
'val':[7,8,9,4,2]})
print (df)
Sheet1 product val
0 abc f aa 7
1 as abc sss 8
2 ss aaa 9
3 abc s 4
4 abcd ddddd 2
df = df[df['Sheet1'].str.contains('abc')]
print (df)
Sheet1 product val
0 abc f aa 7
1 as abc sss 8
2 ss aaa 9
3 abc s 4
4 abcd ddddd 2
df = df.iloc[df['product'].str.len().argsort()]
print (df)
Sheet1 product val
3 abc s 4
0 abc f aa 7
1 as abc sss 8
4 abcd ddddd 2
df = df[['product','val']]
print (df)
product val
3 s 4
0 aa 7
1 sss 8
4 ddddd 2