使用R将数据从PDF提取到CSV

使用R将数据从PDF提取到CSV,r,pdftools,R,Pdftools,我使用以下代码从我的PDF中提取数据: tx <- pdf_text("Name.pdf") tx2 <- unlist(str_split(tx, "[\\r\\n]+")) tx3 <- str_split_fixed(str_trim(tx2), "\\s{2,}", 5) write.csv(tx3, file="Path\\ds1.csv") tx您可以在PDF上共享吗?我认为有两种方法,但很难猜测哪种方法在没有示例的情况下有效。这是一份机密文件,因此无法共享。但例

我使用以下代码从我的PDF中提取数据:

tx <- pdf_text("Name.pdf")
tx2 <- unlist(str_split(tx, "[\\r\\n]+"))
tx3 <- str_split_fixed(str_trim(tx2), "\\s{2,}", 5)
write.csv(tx3, file="Path\\ds1.csv")

tx您可以在PDF上共享吗?我认为有两种方法,但很难猜测哪种方法在没有示例的情况下有效。这是一份机密文件,因此无法共享。但例如,一份文件中有10个子标题,我只想提取第3子标题下的信息。那么我不知道如何帮助您。您可以查看函数
pdftools::pdf_data()
,看看是否可以计算出来。