Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/java/338.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Java 在文本中的数字之前插入换行符_Java_Php_String - Fatal编程技术网

Java 在文本中的数字之前插入换行符

Java 在文本中的数字之前插入换行符,java,php,string,Java,Php,String,我有一个包含6000多行的文本,但我从PDF中复制了它,我必须删除所有换行符,因为在PDF中,每个可见行的末尾都有额外的换行符 所以现在我得到了类似1的结果。文本文本文本2。文本文本3。文本4。文本文本文本。。。文本199。文本200。text 现在的问题是,如何将换行符仅放在数字前面,后面有点和空格,以获得: 1. textextexttexttexttext 2. texttexttexttexttext 3. texttexttexttext 4. texttexttexttext ...

我有一个包含6000多行的文本,但我从PDF中复制了它,我必须删除所有换行符,因为在PDF中,每个可见行的末尾都有额外的换行符

所以现在我得到了类似
1的结果。文本文本文本2。文本文本3。文本4。文本文本文本。。。文本199。文本200。text

现在的问题是,如何将换行符仅放在数字前面,后面有点和空格,以获得:

1. textextexttexttexttext
2. texttexttexttexttext
3. texttexttexttext
4. texttexttexttext
... texttexttext
199. texttexttext
200. texttexttext
最好用PHP或Java编写算法。

替换正则表达式

(\d+\. )


双换行符听起来像windows回车+换行组合(CR+LF)(asc 13,asc 10)。也许可以将原始副本+粘贴的文本,并用
\r\n
替换所有
\n

的实例。你不能要求别人做你的工作,提出一个算法,然后再问它是否正确或是否可以改进。Talnocolas,这就是我现在穿的t恤衫:通常是PPDFs(例外)存储用于描述页面布局的图示符和位置。因此,纯文本通常(除例外)丢失。你复制的内容是Acrobat对原文的最佳猜测,空格、换行符或连字号之类的东西总是有问题。我不确定你在这里想说什么。如果您可以从pdf复制文本并将其保存到文本文件中,那么在windows计算机上生成的换行符将是cr+lf。那又怎样?这与他们描述并试图解决的问题无关。见鬼,这根本不是关于CRLF或任何其他类型的换行符。“我从PDF中复制了它,我不得不删除[…]每个可见行末尾的额外换行符。”。您可能知道,有时人们在一个操作系统上做事情,然后在linux或unix服务器上远程工作,这会对CR+LF有不同的处理方式,包括工具、配置和环境。
\n$1
(?=\d+\. )
\n