Java 使用pdfbox从输出文本中删除新行
使用pdfbox,我可以从PDF中获取文本。正文如下: 使用regex,我试图从Java 使用pdfbox从输出文本中删除新行,java,regex,string,pdfbox,Java,Regex,String,Pdfbox,使用pdfbox,我可以从PDF中获取文本。正文如下: 使用regex,我试图从短语1到短语2获取内容,但看起来我只能在一行中的单词之间获取文本。 我试图用方法删除\n,但我的文本文件总是有上面这样的新行 如何在一个没有行的巨大字符串中获取文本并将其打印在屏幕上?“短语1((?:.|\r?\n)*?)短语2”应该捕获“短语1”和“短语2”之间的所有内容,包括新行。 请参见以下说明: 或者,您可以只使用“dotall”标志,使匹配所有内容,包括新行:好的,如果您首先将其作为字符串获取,则可以调用该
短语1
到短语2
获取内容,但看起来我只能在一行中的单词之间获取文本。
我试图用方法删除\n
,但我的文本文件总是有上面这样的新行
如何在一个没有行的巨大字符串中获取文本并将其打印在屏幕上?“短语1((?:.|\r?\n)*?)短语2”
应该捕获“短语1”
和“短语2”
之间的所有内容,包括新行。请参见以下说明:
或者,您可以只使用“dotall”标志,使
匹配所有内容,包括新行:好的,如果您首先将其作为字符串获取,则可以调用该字符串replaceAll(System.lineSeparator(),“”)
或者如果分隔符不同于系统的分隔符,比如说\n
,则replaceAll(“\n”,““”)
。注意:您可以使用replace
而不是replaceAll
thx执行相同的操作!!它起作用了!最后……)
abcabcabs Phrase 1 123 abc 123
abcabcabs 123 abcabcabs 123 abc 123 Phrase 2 abcabcabs
123 abc 123
PDFTextStripper stripper = new PDFTextStripper();
stripper.setLineSeparator(" ");