R/R Studio:迭代PDF文件夹并转换为R对象

R/R Studio:迭代PDF文件夹并转换为R对象,r,pdf,pdftotext,R,Pdf,Pdftotext,我使用的是RStudio版本1.0.153 我有一个大约30个PDF的文件夹。我想将它们转换为R中的相应对象,作为字符串。我已经有了pdftools包,它成功地转换为对象,我只是想寻找一种方法,让它迭代地遍历文件夹中的PDF列表,自动分配给相应的变量 例如,如果我有30个名为“P1.pdf,P2.pdf,P3.pdf…P30.pdf”的pdf文件,我如何让R使用pdftools将它们全部转换为文本,从而使它们成为各自的R对象,称为P1,P2,P3。。。。P3 非常感谢 我在这里学到了很多 Mee

我使用的是RStudio版本1.0.153

我有一个大约30个PDF的文件夹。我想将它们转换为R中的相应对象,作为字符串。我已经有了pdftools包,它成功地转换为对象,我只是想寻找一种方法,让它迭代地遍历文件夹中的PDF列表,自动分配给相应的变量

例如,如果我有30个名为“P1.pdf,P2.pdf,P3.pdf…P30.pdf”的pdf文件,我如何让R使用pdftools将它们全部转换为文本,从而使它们成为各自的R对象,称为P1,P2,P3。。。。P3

非常感谢

我在这里学到了很多

Meera

这可能有效:

pdf_operations <- function{
... #using whatever operations you may have 
}

fnames <- dir(".//PDF Files/", pattern = "\\.pdf")
sapply(fnames, pdf_operations)

pdf\u操作您自己尝试过什么吗?请查看并考虑编辑您的问题,以反映更多的信息。一般来说,这里的人希望问题能显示出一些努力,因为这个网站不仅仅是为需要帮助的人编写代码。我是一个初学者,我已经尝试了一些东西,显然我是新手。我发布这篇文章并不是为了让别人为我写代码,你的评论在这方面是自以为是的。我仍然很难理解如何编写迭代代码,并且一直在寻求帮助。我没有任何假设,这就是为什么我问你你做了什么。许多新用户获得了“欢迎来到SO,请阅读。我的第一条评论和很多第一次使用的用户从其他更有经验的用户那里得到的评论没有什么不同。我没有否决你的问题,其他人否决了,可能是因为我在评论中指出的原因。我的评论是有建设性的,很抱歉你没有这么看。如果你展示了你尝试过的工作,有人会指出你需要帮助的地方,并提出改进建议。为什么OP必须创建一个新的自定义函数?您是否查看了
pdftools
有哪些函数?如果它们想将一些数据保存到单独的文件(图像或另一个pdf)中,提取一些信息,将其传递给另一个函数进行清理(例如,对于表数据,pdf没有单独的格式),或者只是想以某种方式命名对象。你不知道OP尝试了什么,所以仅仅写一个答案并希望它是正确的答案是回答问题的错误方式。我试过你的解决方案,但从我的判断,它不起作用。这可能是因为您不知道实际的函数是什么以及它将/应该做什么。答案基于提供的信息量,我自己也验证过。OP清楚地提到,他们能够“成功地”将PDF转换为R对象,但需要一种方法来处理大量文件。请重新阅读原始帖子以及其中的问题。答案还指出:这“可能”起作用。最后,请不要对在这里发帖的人发表恶意评论或做出假设——我们都在尽力帮助。如果你有更好的解决方案,请随时发布。我不是有意要表达敌意,我只是直截了当而已。但是这个网站不是建立在“可能”有效的答案之上的。你不知道OP知道或不知道什么,所以你在猜测答案是什么。您的答案应该包括
pdf\u text()
或其他内容。当我使用
pdf\u text
时,sapply无法在我的一个目录中使用pdf的
dir()
输出。