Java Regex subbing out';节字符';在爪哇

Java Regex subbing out';节字符';在爪哇,java,regex,non-ascii-characters,Java,Regex,Non Ascii Characters,我正在运行一系列正则表达式替换(即String.replaceAll调用),将文本文件中的所有特殊字符转换为XML可解析的特殊字符。例如: string_out = string_out.replaceAll("&", "&"); 我遇到了一个绊脚石,替换了“部分字符”,也就是这个小扭曲:§ 首先,我在vi中进行编辑,所以我甚至不能将字符粘贴到其中,因为它不是标准或扩展ascii的成员。出于同样的原因,我也看不到在正则表达式中使用十六进制代码来指定它 如何为正则表达式替

我正在运行一系列正则表达式替换(即String.replaceAll调用),将文本文件中的所有特殊字符转换为XML可解析的特殊字符。例如:

string_out = string_out.replaceAll("&", "&");
我遇到了一个绊脚石,替换了“部分字符”,也就是这个小扭曲:§

首先,我在vi中进行编辑,所以我甚至不能将字符粘贴到其中,因为它不是标准或扩展ascii的成员。出于同样的原因,我也看不到在正则表达式中使用十六进制代码来指定它


如何为正则表达式替换指定此字符?或者,如果你只是想顺便告诉我,已经有一个函数隐藏在某个地方,用于我手工进行的字符转换,那也很酷。

你能简单地使用unicode码点吗?

你能简单地使用unicode码点吗

Unicode: §
Hex:     0xA7
html:    §
name:    section sign
你可以在地图上找到它


您可以在中找到它。

这与我的思路类似,但我与java进行了一些斗争以使其工作。原来是这行代码做的:
string\u out=string\u out.replaceAll(“\\xA7”,“§;”)这里的两个问题是,必须将反斜杠加倍才能生成有效的转义代码,直到a大写,Java仍然不喜欢它。这与我的思路类似,但我与Java进行了一些斗争,以使其工作。原来是这行代码做的:
string\u out=string\u out.replaceAll(“\\xA7”,“§;”)这里的两个问题是反斜杠必须加倍才能生成有效的转义代码,而Java仍然不喜欢它,直到a大写。