R 在制表数据之前删除标点符号
我在从剪贴板中提取数据时遇到了问题,因为剪贴板中碰巧有很多标点符号(引号、逗号等)。我试图通过复制到剪贴板中的R中的一个变量来将作为纯文本文档拉入,以便进行分析 如果我做一个R 在制表数据之前删除标点符号,r,R,我在从剪贴板中提取数据时遇到了问题,因为剪贴板中碰巧有很多标点符号(引号、逗号等)。我试图通过复制到剪贴板中的R中的一个变量来将作为纯文本文档拉入,以便进行分析 如果我做一个 book <- read.table("clipboard", sep="\n") book您需要禁用引用 这对我有用 book <-read.table("http://www.gutenberg.org/cache/epub/1342/pg1342.txt", sep="\n",quote="",stri
book <- read.table("clipboard", sep="\n")
book您需要禁用引用
这对我有用
book <-read.table("http://www.gutenberg.org/cache/epub/1342/pg1342.txt",
sep="\n",quote="",stringsAsFactors=FALSE)
bookread.table
函数用于以矩形结构读入数据并将其放入数据框中。我不期望一本书的文本在总体上符合这种模式。我建议用scan
或readLines
函数代替read.table
读取数据。阅读这些函数的文档,了解如何处理引号和分隔符
如果您仍然想删除标点符号,请查看?gsub
,如果您还想将所有字符转换为大写或小写,请查看?chartr
在您的read.table()
中尝试quote=“”
。如何将代码拆分为多行以使其更具可读性?添加到@Greg Snow中,有[:punct:]gsub中要与“”匹配的模式的字符类。第二,函数tolower()将字符转换为小写。
book <-read.table("http://www.gutenberg.org/cache/epub/1342/pg1342.txt",
sep="\n",quote="",stringsAsFactors=FALSE)