Java 一些ePub将小方形字符“obj”输出到字符串,编码问题?

Java 一些ePub将小方形字符“obj”输出到字符串,编码问题?,java,android,encoding,epub,Java,Android,Encoding,Epub,我正在使用epublib库将文本从epubs获取为字符串。它通过选择一个章节并获取一个流并将其转换为一个字符串来实现。它适用于我尝试过的大多数ePub,但我有一位客户向我发送了一些没有正确显示的ePub,而是显示了一些随机字符,如: 关于如何解决这个问题有什么想法吗 不知道如何获取编码,甚至不知道如何在这个库中设置编码。我也有类似的问题。我必须用gVim打开文件,切换到十六进制视图,看看方块是什么。结果发现它们是奇怪的格式化字符 您可以在原始EPUB中使用字符,例如窄不间断空间或零宽度不间断空间

我正在使用epublib库将文本从epubs获取为字符串。它通过选择一个章节并获取一个流并将其转换为一个字符串来实现。它适用于我尝试过的大多数ePub,但我有一位客户向我发送了一些没有正确显示的ePub,而是显示了一些随机字符,如:

关于如何解决这个问题有什么想法吗


不知道如何获取编码,甚至不知道如何在这个库中设置编码。

我也有类似的问题。我必须用gVim打开文件,切换到十六进制视图,看看方块是什么。结果发现它们是奇怪的格式化字符

您可以在原始EPUB中使用字符,例如窄不间断空间或零宽度不间断空间

这是一个很好的空白字符页面,空白字符可能是随机字符的来源

一旦您确定了冒犯的角色是什么,您可能可以在Java中做一些事情来删除它。但是我没办法。。我不太流利