Java 电子书解析器(.azw、.mobi、epub)?

Java 电子书解析器(.azw、.mobi、epub)?,java,android,parsing,Java,Android,Parsing,我想开发一个电子书阅读器应用程序。有哪些好的库可用于解析.azw、.mobi、.pdf等格式?正如Ranhiru所说,您可以看到pdf是如何解析的。 但是,对于.mobi,没有库,因此您必须自己解析格式。可以阅读格式的完整规范 与.azw文件不同的是:如果Kindle电子书没有DRM,那么它的格式与.mobi文件一致,也就是说,它们完全可以互换。否则,这将非常困难,因为您还必须生成Kindle PID并执行.azw文件的去DRM。在桌面上有一个关于如何做到这一点的指南。但是,不建议使用它,因为它

我想开发一个电子书阅读器应用程序。有哪些好的库可用于解析.azw、.mobi、.pdf等格式?

正如Ranhiru所说,您可以看到pdf是如何解析的。 但是,对于
.mobi
,没有库,因此您必须自己解析格式。可以阅读格式的完整规范


.azw
文件不同的是:如果Kindle电子书没有DRM,那么它的格式与
.mobi
文件一致,也就是说,它们完全可以互换。否则,这将非常困难,因为您还必须生成Kindle PID并执行
.azw
文件的去DRM。在桌面上有一个关于如何做到这一点的指南。但是,不建议使用它,因为它破坏了DRM的整个要点,几乎在任何地方都是非法的。

对于mobi,没有完整的规格表可用,但您应该直接跳转到由mobi扩展和使用的PDB格式


一些可能对您有帮助的问题。还有,是的,但这只适用于PDF。epub只是一个压缩的html文件,因此也可以解决其他问题?虽然找到一个库可能是最简单的解决方案(没有判断,我也会找一个),但如果找不到,请调查这些文件实际上是什么。在某些情况下,它们要么是文本,要么是图像。找出一种格式与另一种格式的区别。例如,Richard说epubs是压缩的html。因此,解压它,并解析应用程序中的html。当然,您可以找到一个html解析库。看起来这将是比你期望的更多的工作,但这将是一个很好的锻炼。嘿,如果你能很好地编码,你可以制作一个电子书库供其他人使用:)