Java 编码问题-断字符
在Java 编码问题-断字符,java,php,encoding,utf-8,character-encoding,Java,Php,Encoding,Utf 8,Character Encoding,在PHP或Java上是否有检测编码问题的方法 我的意思是,有时文本会被破坏,比如 如下图所示。记事本++有一些黑色字符,里面有代码。那是因为他注意到这是个问题 我想在PHP或Java上检测到这一点,因此我可以对该文件进行批量替换,以替换UTF-8字符 这是一个大问题的一部分。我只是把它简化为一个最低的 在HxD十六进制编辑器(用于编码ANSI)上,您可以看到这些字符是(十六进制):93和94 在记事本++(使用编码UTF-8)上,您还可以获得这些黑色背景的代码 我真的需要找到一种方法来检测这些坏
PHP
或Java
上是否有检测编码问题的方法
我的意思是,有时文本会被破坏,比如
如下图所示。记事本++有一些黑色字符,里面有代码。那是因为他注意到这是个问题
我想在PHP
或Java
上检测到这一点,因此我可以对该文件进行批量替换,以替换UTF-8字符
这是一个大问题的一部分。我只是把它简化为一个最低的
在HxD十六进制编辑器(用于编码ANSI
)上,您可以看到这些字符是(十六进制):93和94
在记事本++(使用编码UTF-8
)上,您还可以获得这些黑色背景的代码
我真的需要找到一种方法来检测这些坏字符的位置
如果您知道使用另一个程序实现此检测的其他方法,该程序允许我进行批量替换,这将对我有用
使用记事本+++
我甚至无法搜索该文本。我的意思是,它向您显示了问题,但如果您复制该字符并在Notepad++
上查找它,则无法进行替换
在PHP上有一个检测文本是否正确的函数:mb\u check\u encoding
,但它不允许我进行替换
记事本++有一些黑色字符,里面有代码。那是因为他注意到这是一个问题。
-->事实并非如此。记事本++向您显示了当前选定字符集中字节顺序的含义。但记事本++向您显示了这一点,因为存在问题(断字符)。如果字符是ok,那么Notepad++将显示正确的字符。正如您在其他屏幕截图(可能是同一个文件)中看到的,字符没有损坏。它不是ASCII字符。告诉记事本++使用哪种编码读取文件将解决您的问题。我下载了您的文件,并刚刚在记事本++中打开。请参阅屏幕截图:因为Notepad++正在向您显示带有ANSI编码的文件。点击:UTF-8编码/编码。这将向您展示具有UTF-8编码的文档,这是我感兴趣的编码。