Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/string/5.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/3/apache-spark/6.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
在R中把一个长字符串分成完整的句子_R_String_Stringr - Fatal编程技术网

在R中把一个长字符串分成完整的句子

在R中把一个长字符串分成完整的句子,r,string,stringr,R,String,Stringr,我有从互联网上提取的字符串数据。我想把它分解成完整的句子 例如: library(RXKCD) library(stringr) searchXKCD("health") getXKCD(574) tweets <- getXKCD(574) tweets$transcript # This is the string I want to parse. cols <- str_extract_all(tweets$transcript, "[A

我有从互联网上提取的字符串数据。我想把它分解成完整的句子

例如:

library(RXKCD)
library(stringr)

searchXKCD("health")

getXKCD(574)
tweets <- getXKCD(574)

tweets$transcript  # This is the string I want to parse.

cols <- str_extract_all(tweets$transcript, "[A-Za-z]+") # I know how to pull out the words separated, but that's not what I want to do.

# just because
freq <- table(cols)

plot(freq)
库(RXKCD)
图书馆(stringr)
searchXKCD(“健康”)
getXKCD(574)

tweets这只是一个解析字符串并将其切割成适当段的例子:

strsplit(strsplit(tweets$transcript,”(\\\\\\\\})\\\\\\\{)”)[[1][3],“\n”)[[1][-1]
#>[1]“SKEEVE37:哦,天哪,在我知道猪流感之前,我昨天吃了猪肉!”
#>[2]“汉诺雷克:没有管道胶带,我无法密封门以防猪流感,但我无法在不出去的情况下获得管道胶带!救命!”
#>[3]“PAULYSHOREFAN:猪流感在马达加斯加传播到我这里需要多长时间?”
#>[4]“疯狂74:猪流感是上帝对美国公民自由联盟(ACLU)和女同性恋者的惩罚,9”
#>[5]“11和纳米机器人!”
#>[6]“暮光之城7531:我从楼梯上摔下来,有一条裂缝,一个锯齿状的白色东西从我的手臂伸出来伙计们,这是猪流感吗?”
#>[7]“维古:@UNTOWARD:不,听起来像梅毒,不是猪流感。你说你对猪做了什么?”
#>[8]“2011年自闭症规则:我爸爸说流感疫苗与自闭症有关,所以为了避免猪流感,我正试图舔一个自闭症儿童。”

尝试使用
stru wrap
width
可以显示一些可复制的数据吗?这与
RXKCD
没有任何关系,你可以发布(使用
dput
)你从
getXKCD
得到的结果吗?这个问题实际上只是关于字符串,因此减少了(深奥/罕见但公认很酷)软件包有助于获得曝光和答案。谢谢!@r2evans我想我不认为它是骑士式的。我认为它是相关的,我想让它对每个人都更简单、更简洁。这不是骑士式的。也许我错了,当然。“更有趣”下载漫画很有趣。谢谢@r2evans,我很欣赏你的观点!让我(一只老狗)不断学习…谢谢@Allan!我会看看是否可以从那里进一步解析它。一般来说,我对字符串解析不太精通,所以这有助于我的理解(通过查看片段).我最后做了这个:科尔斯