将PDF文档传递给R函数

将PDF文档传递给R函数,r,function,api,pdf,R,Function,Api,Pdf,我在R中有一个函数(如下文)。我需要将其作为API公开。函数当前希望传递指向PDF文件的路径。然后,它将刮取该PDF文件,并进一步处理生成的字符串。问题在于,在实时环境中,系统需要下载PDF文件,而不必将其存储在任何地方。因此,函数/API需要向其传递PDF对象,而不是路径。我不知道如何编写函数,以便它接受PDF对象?我已经读到blob是表示二进制数据的对象,并认为这可能是一条途径(让系统将PDF文件转换为blob并将blob传递给函数),但我不确定。任何想法或链接将不胜感激 # path t

我在R中有一个函数(如下文)。我需要将其作为API公开。函数当前希望传递指向PDF文件的路径。然后,它将刮取该PDF文件,并进一步处理生成的字符串。问题在于,在实时环境中,系统需要下载PDF文件,而不必将其存储在任何地方。因此,函数/API需要向其传递PDF对象,而不是路径。我不知道如何编写函数,以便它接受PDF对象?我已经读到blob是表示二进制数据的对象,并认为这可能是一条途径(让系统将PDF文件转换为blob并将blob传递给函数),但我不确定。任何想法或链接将不胜感激


# path to the document
path = '//path/folder/file.pdf'



# function
function_absa_bank_statement_details <- function(path = "null"){
  
  
  if(path == "null"){
    
    result <- "No document"
    
  } else{
    
    raw_text <- pdf_text(path)
    list_lines <- strsplit(as.character(raw_text[1]), "\r\n")
    product_type <- str_trim(list_lines[[1]][17])
    account_number <- gsub("-", "", str_trim(function_get_substring(list_lines[[1]][9], ': ', 'end_line')))
    account_holder <- str_trim(list_lines[[1]][13])
    date_range <- gsub("/", "-", substr(str_trim(function_get_substring(list_lines[[1]][19], 'VIR TYDPERK: ', 'end_line')), 1, 23))
    start_date <- function_alter_string_date_format(substr(date_range, 1, 10))
    end_date <- function_alter_string_date_format(str_trim(function_get_substring(date_range, ' - ', 'end_line')))

  }
  
  
  return(list(
    "product_type" = product_type,
    "account_number" = account_number,
    "account_holder" = account_holder,
    "start_date" = start_date,
    "end_date" = end_date
  ))
  
  
}



#文档的路径
path='//path/folder/file.pdf'
#作用

函数\u absa\u银行\u对账单\u详细信息我相信,您需要将PDF存储为临时文件才能正常工作。我相信,您需要将PDF存储为临时文件才能正常工作。