Javascript 如何使用pentaho从PDF中提取文本?

Javascript 如何使用pentaho从PDF中提取文本?,javascript,java,pentaho,Javascript,Java,Pentaho,如何使用pentaho从PDF文件中读取文本 有没有只使用内置java库的解决方案?只需添加一个步骤JavaScript修改值,并使用以下代码: var reader = new com.lowagie.text.pdf.PdfReader("c:\\temp\\mypdf.pdf") // OR JUST PUT THE COLUMN NAME IN THE FLOW; var pdfTE = new com.lowagie.text.pdf.parser.PdfTextExtractor(r

如何使用pentaho从PDF文件中读取文本


有没有只使用内置java库的解决方案?

只需添加一个步骤
JavaScript修改值
,并使用以下代码:

var reader = new com.lowagie.text.pdf.PdfReader("c:\\temp\\mypdf.pdf") // OR JUST PUT THE COLUMN NAME IN THE FLOW;
var pdfTE = new com.lowagie.text.pdf.parser.PdfTextExtractor(reader);
var noOfPages = reader.getNumberOfPages();
var textPDF = "";
for (var i = 1; i <= noOfPages; i++) {
    textPDF += pdfTE.getTextFromPage(i);
}
var reader=new com.lowagie.text.pdf.PdfReader(“c:\\temp\\mypdf.pdf”)//或者只将列名放入流中;
var pdfTE=new com.lowagie.text.pdf.parser.PdfTextExtractor(reader);
var noofpage=reader.getNumberOfPages();
var textpf=“”;

对于(var i=1;i)您到目前为止尝试了什么?请提供MCVE: