Stream 使用PDFBox从PDF正文中提取流转储
我想用PDFBox从PDF中提取流转储。 PDFBox是否可以实现这一点 我想获得PDF内容的原始十六进制代码,如下所示:Stream 使用PDFBox从PDF正文中提取流转储,stream,pdfbox,dump,Stream,Pdfbox,Dump,我想用PDFBox从PDF中提取流转储。 PDFBox是否可以实现这一点 我想获得PDF内容的原始十六进制代码,如下所示: BT /F19 8.9664 Tf 96.197 606.119 Td [(Kommunikation)]TJ ET q 1 0 0 1 85.238 594.35 cm []0 d 0 J 0.398 w 0 0 m 0 7.352 l S Q BT /F19 8.9664 Tf 133.856 595.758 Td [(Erster)-600(Testuebertrag
BT /F19 8.9664 Tf 96.197 606.119 Td [(Kommunikation)]TJ
ET
q
1 0 0 1 85.238 594.35 cm
[]0 d 0 J 0.398 w 0 0 m 0 7.352 l S
Q
BT
/F19 8.9664 Tf 133.856 595.758 Td [(Erster)-600(Testuebertrag)-600(auf)-600(die)-600(Neuentwicklung)-600(fuer)-600(die)-600(PSA)-600(Direktbank)-600(ma)]TJ
ET
q
1 0 0 1 85.238 583.989 cm
[]0 d 0 J 0.398 w 0 0 m 0 7.352 l S
Q
BT
/F19 8.9664 Tf 133.856 585.397 Td [(l)-600(mit)-600(sehr)-600(langen)-600(Verwendungszweck)-600(gleich)-600(zum)-600(testen)-600(wann)-600(dieser)-600(cuted)]TJ
ET
thx对于一次性使用,运行并查找“内容”
对于多次使用,请在第一页使用此代码:
try (PDDocument doc = PDDocument.load(new File("XXX.pdf"));
InputStream contents = doc.getPage(0).getContents())
{
IOUtils.copy(contents, System.out);
}
请注意,这只会转储页面内容流。xobject表单、模式、软掩码、注释外观流中可能还有其他内容流。PDF相当复杂