R上的读取行\R\n不是\R\n
我有许多webchat日志,如下所示:R上的读取行\R\n不是\R\n,r,R,我有许多webchat日志,如下所示: Agent: Click here. \n Then click here. \n Then do this. \r\n Customer: Show me. \r\n Agent: Ok. \n One Second. \r\n 当我将它们导入到R中时,我只想将\R\n视为新行,而不是\R\n。我在readline()中看不到这样做的选项?有没有最好的办法 这里有一个关于Python中堆栈溢出的解决方案:我研究了是否可以使用readLines
Agent: Click here. \n Then click here. \n Then do this. \r\n
Customer: Show me. \r\n
Agent: Ok. \n One Second. \r\n
当我将它们导入到R中时,我只想将\R\n视为新行,而不是\R\n。我在readline()中看不到这样做的选项?有没有最好的办法
这里有一个关于Python中堆栈溢出的解决方案:我研究了是否可以使用
readLines()
来实现这一点,但我没有看到使用readLines()
实现这一点的简单方法
基本函数readline()
在这里似乎没有用处
解决方法是使用scan读取文本,然后解析结果
例如,如果您的文本在foo.txt中:
words <- scan("foo.txt", what = "character")
words2 <- words[words != "\\n"]
onepar <- paste(words2, collapse = " ")
library(stringr)
lines <- str_split(onepar, pattern = fixed(" \\r\\n"), simplify = TRUE)
lines
[,1] [,2] [,3] [,4]
[1,] "Agent: Click here. Then click here. Then do this." " Customer: Show me." " Agent: Ok. One Second." ""
words我研究了是否可以使用readLines()
来实现这一点,但我没有发现使用readLines()
实现这一点的简单方法
基本函数readline()
在这里似乎没有用处
解决方法是使用scan读取文本,然后解析结果
例如,如果您的文本在foo.txt中:
words <- scan("foo.txt", what = "character")
words2 <- words[words != "\\n"]
onepar <- paste(words2, collapse = " ")
library(stringr)
lines <- str_split(onepar, pattern = fixed(" \\r\\n"), simplify = TRUE)
lines
[,1] [,2] [,3] [,4]
[1,] "Agent: Click here. Then click here. Then do this." " Customer: Show me." " Agent: Ok. One Second." ""
单词我认为如果你用readr::read_file
而不是scan
,它会变得简单一点。如果你用readr::read_file
而不是scan
,它会变得简单一点。