Ruby on rails 用于解析.doc文件的Ruby库?
我只是想知道是否有人知道有什么好的库可以解析.doc文件(以及类似的格式,比如.odt)来提取文本,同时还可以保留格式信息,以便在网站上显示 能够为PDF做类似的事情将是一个额外的收获,但我不太期待 这是针对Rails项目的,如果这有帮助的话Ruby on rails 用于解析.doc文件的Ruby库?,ruby-on-rails,ruby,pdf,parsing,ms-word,Ruby On Rails,Ruby,Pdf,Parsing,Ms Word,我只是想知道是否有人知道有什么好的库可以解析.doc文件(以及类似的格式,比如.odt)来提取文本,同时还可以保留格式信息,以便在网站上显示 能够为PDF做类似的事情将是一个额外的收获,但我不太期待 这是针对Rails项目的,如果这有帮助的话 提前谢谢 Apache是访问Word和Excel文档的一种非常流行的方式。有一个可能值得研究的问题,但看起来你必须自己构建它。而且API看起来不像Ruby,因为它实际上是Java代码的直接端口。而且它似乎只针对Ruby 1.8.2进行了测试。非常感谢您的链
提前谢谢 Apache是访问Word和Excel文档的一种非常流行的方式。有一个可能值得研究的问题,但看起来你必须自己构建它。而且API看起来不像Ruby,因为它实际上是Java代码的直接端口。而且它似乎只针对Ruby 1.8.2进行了测试。非常感谢您的链接;我会调查的。(+1)@PlatinumAzure自2010年以来情况发生了变化吗?谢谢