Warning: file_get_contents(/data/phpspider/zhask/data//catemap/5/ruby/21.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Ruby on rails 用于解析.doc文件的Ruby库?_Ruby On Rails_Ruby_Pdf_Parsing_Ms Word - Fatal编程技术网

Ruby on rails 用于解析.doc文件的Ruby库?

Ruby on rails 用于解析.doc文件的Ruby库?,ruby-on-rails,ruby,pdf,parsing,ms-word,Ruby On Rails,Ruby,Pdf,Parsing,Ms Word,我只是想知道是否有人知道有什么好的库可以解析.doc文件(以及类似的格式,比如.odt)来提取文本,同时还可以保留格式信息,以便在网站上显示 能够为PDF做类似的事情将是一个额外的收获,但我不太期待 这是针对Rails项目的,如果这有帮助的话 提前谢谢 Apache是访问Word和Excel文档的一种非常流行的方式。有一个可能值得研究的问题,但看起来你必须自己构建它。而且API看起来不像Ruby,因为它实际上是Java代码的直接端口。而且它似乎只针对Ruby 1.8.2进行了测试。非常感谢您的链

我只是想知道是否有人知道有什么好的库可以解析.doc文件(以及类似的格式,比如.odt)来提取文本,同时还可以保留格式信息,以便在网站上显示

能够为PDF做类似的事情将是一个额外的收获,但我不太期待

这是针对Rails项目的,如果这有帮助的话


提前谢谢

Apache是访问Word和Excel文档的一种非常流行的方式。有一个可能值得研究的问题,但看起来你必须自己构建它。而且API看起来不像Ruby,因为它实际上是Java代码的直接端口。而且它似乎只针对Ruby 1.8.2进行了测试。

非常感谢您的链接;我会调查的。(+1)@PlatinumAzure自2010年以来情况发生了变化吗?谢谢