如何在R中进行字符串拆分?
我有这样一个数据框:如何在R中进行字符串拆分?,r,string,strsplit,R,String,Strsplit,我有这样一个数据框: Screen.name party users 1 A_Gloeckner SPD @MartinSchulz. 2 A_Gloeckner SPD @MartinSchulz 3 A_Gloeckner SPD @ManuelaSchwesig @sigmargabriel @nahle
Screen.name party users
1 A_Gloeckner SPD @MartinSchulz.
2 A_Gloeckner SPD @MartinSchulz
3 A_Gloeckner SPD @ManuelaSchwesig @sigmargabriel @nahles
4 a_grotheer SPD @SouthendRNLI
5 a_grotheer SPD @ribasdiego10
6 a_grotheer SPD @HBBuergerschaft
7 a_grotheer SPD @UniBremen…
我希望拆分第3列,并使数据框如下所示:
Screen.name party users
1 A_Gloeckner SPD @MartinSchulz.
2 A_Gloeckner SPD @MartinSchulz
3 A_Gloeckner SPD @ManuelaSchwesig @sigmargabriel @nahles
4 a_grotheer SPD @SouthendRNLI
5 a_grotheer SPD @ribasdiego10
6 a_grotheer SPD @HBBuergerschaft
7 a_grotheer SPD @UniBremen…
Screen.name party mentioned_users
1 A_Gloeckner SPD @MartinSchulz.
2 A_Gloeckner SPD @MartinSchulz
3 A_Gloeckner SPD @ManuelaSchwesig
4 A_Gloeckner SPD @sigmargabriel
5 A_Gloeckner SPD @nahles
6 a_grotheer SPD @SouthendRNLI
7 a_grotheer SPD @ribasdiego10
8 a_grotheer SPD @HBBuergerschaft
9 a_grotheer SPD @UniBremen…
到目前为止,我已经尝试过这个:
提及2017年政治政策=提及2017年政治政策[,列表(提及2017年政治政策=未列出(strsplit(提及2017年政治政策,“,”),by=提及2017年政治政策$Screen.name]
Screen.name party users
1 A_Gloeckner SPD @MartinSchulz.
2 A_Gloeckner SPD @MartinSchulz
3 A_Gloeckner SPD @ManuelaSchwesig @sigmargabriel @nahles
4 a_grotheer SPD @SouthendRNLI
5 a_grotheer SPD @ribasdiego10
6 a_grotheer SPD @HBBuergerschaft
7 a_grotheer SPD @UniBremen…
但它向我展示了一个错误,“在[.data.frame
中出现错误”(提及2017年政治政策,列表
未使用的参数(by=提及_politis_2017$Screen.name)”
Screen.name party users
1 A_Gloeckner SPD @MartinSchulz.
2 A_Gloeckner SPD @MartinSchulz
3 A_Gloeckner SPD @ManuelaSchwesig @sigmargabriel @nahles
4 a_grotheer SPD @SouthendRNLI
5 a_grotheer SPD @ribasdiego10
6 a_grotheer SPD @HBBuergerschaft
7 a_grotheer SPD @UniBremen…
谢谢。你可以试试
Screen.name party users
1 A_Gloeckner SPD @MartinSchulz.
2 A_Gloeckner SPD @MartinSchulz
3 A_Gloeckner SPD @ManuelaSchwesig @sigmargabriel @nahles
4 a_grotheer SPD @SouthendRNLI
5 a_grotheer SPD @ribasdiego10
6 a_grotheer SPD @HBBuergerschaft
7 a_grotheer SPD @UniBremen…
library(tidyverse)
df %>%
separate_rows(users, sep=" ")
Screen.name party users
1 A_Gloeckner SPD @MartinSchulz.
2 A_Gloeckner SPD @MartinSchulz
3 A_Gloeckner SPD @ManuelaSchwesig
4 A_Gloeckner SPD @sigmargabriel
5 A_Gloeckner SPD @nahles
6 a_grotheer SPD @SouthendRNLI
7 a_grotheer SPD @ribasdiego10
8 a_grotheer SPD @HBBuergerschaft
9 a_grotheer SPD @UniBremen
资料
Screen.name party users
1 A_Gloeckner SPD @MartinSchulz.
2 A_Gloeckner SPD @MartinSchulz
3 A_Gloeckner SPD @ManuelaSchwesig @sigmargabriel @nahles
4 a_grotheer SPD @SouthendRNLI
5 a_grotheer SPD @ribasdiego10
6 a_grotheer SPD @HBBuergerschaft
7 a_grotheer SPD @UniBremen…
df到目前为止您尝试过什么?提及2017年政治政策=提及2017年政治政策[,列表(提及2017年政治政策=未列出(strsplit(提及2017年政治政策,,”),by=提及2017年政治政策$Screen.name]@你能用你所做的和可能的输出来更新这个问题吗?这将帮助所有人。我之前已经调查过这个问题的答案。我尝试过几乎所有的替代方法。但是我的数据帧本身有一些问题。我想拆分的字符串有一个奇怪的格式,我想是分隔符问题。他说例如,第三行元素显示的内容是:strsplit(提及政治2017[3,3],“)[[1]][1]”“@ManuelaSchwesig”“@sigmargabriel”“@nahles”