Java 我需要正则表达式引擎中的一个模式来忽略一组特定的字符(例如:“~~”)

Java 我需要正则表达式引擎中的一个模式来忽略一组特定的字符(例如:“~~”),java,regex,pattern-matching,Java,Regex,Pattern Matching,我正在进行pdf文件转换。为了安全起见,我需要用其他值替换原始数量值。 但是,在将pdf文件解析为普通文本文件时,所有内容都集中在一行中。因此,在解析过程中,我会在每行末尾添加一些符号,如~\n。现在的问题是~~等字符可能在解析后出现在页面内容的任何部分。因此,我需要在该内容中执行正则表达式。但是需要忽略页面中的char~ 字符串12可能与下面显示的任何一个类似。 12 12~~ 1~~2 1~~2~~ ~~12 ~~12~~ ~~1~~2 ~~1~~2~~->只需将字符串与此字符进行排列即可。

我正在进行pdf文件转换。为了安全起见,我需要用其他值替换原始数量值。 但是,在将pdf文件解析为普通文本文件时,所有内容都集中在一行中。因此,在解析过程中,我会在每行末尾添加一些符号,如~\n。现在的问题是~~等字符可能在解析后出现在页面内容的任何部分。因此,我需要在该内容中执行正则表达式。但是需要忽略页面中的char~

字符串12可能与下面显示的任何一个类似。 12 12~~ 1~~2 1~~2~~ ~~12 ~~12~~ ~~1~~2 ~~1~~2~~->只需将字符串与此字符进行排列即可。所以我想要一个与字符串12匹配的正则表达式,不管排列如何,或者忽略字符~~

我想知道如何忽略这个角色,而不是删除它

大家好,我给大家举了一个字符串为12的例子,让大家了解情况。下面的答案肯定会满足我给出的示例的要求,但这不是我真正的意思…每个pdf的内容都会有所不同,而且pdf的内容是巨大的!!!即使我知道整个pdf的内容,只要假设我可以插入多少个位置?:~~?进入:

(?:~~)?1(?:~~)?2(?:~~)?
匹配所有示例字符串。这就是你的意思吗

说明:

?:~~将两个波浪形组合为一个非捕获组。 ? 使该组成为可选组。 ~*? 匹配所有示例字符串,如 12 12~~ 1~~2 1~~2~~ ~~12 ~~12~~ ~~1~~2 ~~~1~~2~~ ab ab~~ a~~b ~~
~.a~9

您是在寻求帮助还是将工作外包给我们?您是如何从pdfHi@Anirudh中提取数据的:解析pdf文件时,所有空格、换行符和所有不可打印字符在转换后都不会显示。所以我用这些符号来区分它们。如果改用\n,即使单词之间的空格在最后编译成pdf时也会换行。谢谢,但字符串12只是一个示例,不是我的意思,请阅读问题部分中的注释,我已经对情况作了更深入的解释。@LegendaryGenius:如果简化后的版本实际上不再准确地反映您的问题,那么对问题进行简化不是一个好主意。另外,如果你需要澄清你的问题,请使用链接在问题本身中澄清,而不是在不是每个人都看到的评论中。感谢提示:我是这个网站的新手:P不管怎样,既然你明白了我问题的重点,你还有其他答案吗???要使正则表达式引擎忽略特定字符???@LegendaryGenius:您需要显示您当前使用的正则表达式,该正则表达式尚未处理~~ s,然后我可以尝试找出如何使其忽略~~。否则,我的下一个猜测将和第一个猜测一样对你毫无用处:我现在只使用第一个答案中已经使用的方法…我想使用的东西就像税务PDF中的一年匹配,通常是1098和1099年,所以我只是像…?:~?1:~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~。但是我需要帮助让它在匹配中忽略这个角色本身。。。至少我需要知道是否有可能让引擎忽略这样的事情…你能发送整个模式^o吗?因为我真的不知道上面的结果如何匹配,对我来说,它与我的任何结果都不匹配: