R 在制表数据之前删除标点符号

R 在制表数据之前删除标点符号,r,R,我在从剪贴板中提取数据时遇到了问题,因为剪贴板中碰巧有很多标点符号(引号、逗号等)。我试图通过复制到剪贴板中的R中的一个变量来将作为纯文本文档拉入,以便进行分析 如果我做一个 book <- read.table("clipboard", sep="\n") book您需要禁用引用 这对我有用 book <-read.table("http://www.gutenberg.org/cache/epub/1342/pg1342.txt", sep="\n",quote="",stri

我在从剪贴板中提取数据时遇到了问题,因为剪贴板中碰巧有很多标点符号(引号、逗号等)。我试图通过复制到剪贴板中的R中的一个变量来将作为纯文本文档拉入,以便进行分析

如果我做一个

book <- read.table("clipboard", sep="\n")

book您需要禁用引用

这对我有用

book <-read.table("http://www.gutenberg.org/cache/epub/1342/pg1342.txt",
sep="\n",quote="",stringsAsFactors=FALSE)

bookread.table
函数用于以矩形结构读入数据并将其放入数据框中。我不期望一本书的文本在总体上符合这种模式。我建议用
scan
readLines
函数代替
read.table
读取数据。阅读这些函数的文档,了解如何处理引号和分隔符


如果您仍然想删除标点符号,请查看
?gsub
,如果您还想将所有字符转换为大写或小写,请查看
?chartr

在您的
read.table()
中尝试
quote=“”
。如何将代码拆分为多行以使其更具可读性?添加到@Greg Snow中,有[:punct:]gsub中要与“”匹配的模式的字符类。第二,函数tolower()将字符转换为小写。
book <-read.table("http://www.gutenberg.org/cache/epub/1342/pg1342.txt",
sep="\n",quote="",stringsAsFactors=FALSE)