如何使用R获取pdf中每个页面的大小(不是页面大小,而是MB)?

如何使用R获取pdf中每个页面的大小(不是页面大小,而是MB)?,r,pdf,split,R,Pdf,Split,我正在尝试将一个pdf拆分为多个pdf,但所有pdf都必须具有相似的大小。我希望pdf按大小分割,而不是按一些标记或每10页左右。我知道有些页面由于颜色、数字等因素而变得更大 我尝试使用staplr包的select_pages函数和for循环来创建pdf,检查大小,如果不符合所需大小,则将其删除。但是,这个过程太慢了 我需要一些东西来快速获得pdf的每一页的大小,这样我就可以按大小进行拆分。如果我做对了,您可以使用pdftools: # Arguments pdf_file <- &quo

我正在尝试将一个pdf拆分为多个pdf,但所有pdf都必须具有相似的大小。我希望pdf按大小分割,而不是按一些标记或每10页左右。我知道有些页面由于颜色、数字等因素而变得更大

我尝试使用staplr包的select_pages函数和for循环来创建pdf,检查大小,如果不符合所需大小,则将其删除。但是,这个过程太慢了


我需要一些东西来快速获得pdf的每一页的大小,这样我就可以按大小进行拆分。

如果我做对了,您可以使用
pdftools

# Arguments
pdf_file <- "input.pdf" # file name
thres = 2 # size in Mb

# Create temporary folder based on local time
tmp <- gsub(":|-| ", "", Sys.time())
dir.create(tmp)

# Split pages
invisible(pdf_split(pdf_file, paste0(tmp, '/page')))
# Get page files' names
pages <- list.files(tmp, full.names = T)
# Get page files' sizes
page_sizes <- sapply(pages, function(page) file.info(page)$size) / 10^6

# Remove pages with sizes bigger than a threshold
pages_ok <- pages[page_sizes <= size]

# Do whatever you wanna do (here, I'm creating a pdf with acceptable page sizes)
pdf_combine(pages_ok, output = "output.pdf")

# Remove temporary folder
unlink(tmp, recursive = T)
#参数

pdf_file如果我做对了,您可以使用
pdftools

# Arguments
pdf_file <- "input.pdf" # file name
thres = 2 # size in Mb

# Create temporary folder based on local time
tmp <- gsub(":|-| ", "", Sys.time())
dir.create(tmp)

# Split pages
invisible(pdf_split(pdf_file, paste0(tmp, '/page')))
# Get page files' names
pages <- list.files(tmp, full.names = T)
# Get page files' sizes
page_sizes <- sapply(pages, function(page) file.info(page)$size) / 10^6

# Remove pages with sizes bigger than a threshold
pages_ok <- pages[page_sizes <= size]

# Do whatever you wanna do (here, I'm creating a pdf with acceptable page sizes)
pdf_combine(pages_ok, output = "output.pdf")

# Remove temporary folder
unlink(tmp, recursive = T)
#参数
pdf\u文件