Java 未知字符

Java 未知字符,java,unicode,character-encoding,Java,Unicode,Character Encoding,我从文件中读取编码为“UTF-8”的字符串。我需要把它和一个表达式匹配起来。 文件的第一个字符是#,但字符串中的第一个字符是'(空符号)。我已经用字符集“UTF-8”将它翻译成字节,这里是[-17,-69,-65]。有人知道它是什么以及如何用regexprs解决吗?一些编辑器(如记事本)在保存UTF-8文本时添加BOM(字节顺序掩码)签名。在从这样的文件中读取字符串之前,应该检查0xEF、0xBB、0xBF字节,如果存在,则跳过它们 另一种方法是不要使用记事本编辑UTF-8文本,使用记事本++、

我从文件中读取编码为“UTF-8”的字符串。我需要把它和一个表达式匹配起来。 文件的第一个字符是
#
,但字符串中的第一个字符是
'
(空符号)。我已经用字符集“UTF-8”将它翻译成字节,这里是
[-17,-69,-65]
。有人知道它是什么以及如何用regexprs解决吗?

一些编辑器(如记事本)在保存UTF-8文本时添加BOM(字节顺序掩码)签名。在从这样的文件中读取字符串之前,应该检查0xEF、0xBB、0xBF字节,如果存在,则跳过它们

另一种方法是不要使用记事本编辑UTF-8文本,使用记事本++、凯特或其他任何可以控制添加BOM的程序。

可以粘贴文件开头吗?也就是说,Java甚至还没有接触到原始数据。