Java 编码问题-断字符

Java 编码问题-断字符,java,php,encoding,utf-8,character-encoding,Java,Php,Encoding,Utf 8,Character Encoding,在PHP或Java上是否有检测编码问题的方法 我的意思是,有时文本会被破坏,比如 如下图所示。记事本++有一些黑色字符,里面有代码。那是因为他注意到这是个问题 我想在PHP或Java上检测到这一点,因此我可以对该文件进行批量替换,以替换UTF-8字符 这是一个大问题的一部分。我只是把它简化为一个最低的 在HxD十六进制编辑器(用于编码ANSI)上,您可以看到这些字符是(十六进制):93和94 在记事本++(使用编码UTF-8)上,您还可以获得这些黑色背景的代码 我真的需要找到一种方法来检测这些坏

PHP
Java
上是否有检测
编码问题的方法

我的意思是,有时文本会被破坏,比如

如下图所示。记事本++有一些黑色字符,里面有代码。那是因为他注意到这是个问题

我想在
PHP
Java
上检测到这一点,因此我可以对该文件进行批量替换,以替换UTF-8字符

这是一个大问题的一部分。我只是把它简化为一个最低的

在HxD十六进制编辑器(用于编码
ANSI
)上,您可以看到这些字符是(十六进制):93和94

在记事本++(使用编码
UTF-8
)上,您还可以获得这些黑色背景的代码

我真的需要找到一种方法来检测这些坏字符的位置

如果您知道使用另一个程序实现此检测的其他方法,该程序允许我进行批量替换,这将对我有用

使用记事本+++
我甚至无法搜索该文本。我的意思是,它向您显示了问题,但如果您复制该字符并在
Notepad++
上查找它,则无法进行替换

在PHP上有一个检测文本是否正确的函数:
mb\u check\u encoding
,但它不允许我进行替换


记事本++有一些黑色字符,里面有代码。那是因为他注意到这是一个问题。
-->事实并非如此。记事本++向您显示了当前选定字符集中字节顺序的含义。但记事本++向您显示了这一点,因为存在问题(断字符)。如果字符是ok,那么Notepad++将显示正确的字符。正如您在其他屏幕截图(可能是同一个文件)中看到的,字符没有损坏。它不是ASCII字符。告诉记事本++使用哪种编码读取文件将解决您的问题。我下载了您的文件,并刚刚在记事本++中打开。请参阅屏幕截图:因为Notepad++正在向您显示带有ANSI编码的文件。点击:UTF-8编码/编码。这将向您展示具有UTF-8编码的文档,这是我感兴趣的编码。