Ruby on rails 使用pdf2htmlEX和kristin gem将PDF转换为HTML

Ruby on rails 使用pdf2htmlEX和kristin gem将PDF转换为HTML,ruby-on-rails,ruby,ruby-on-rails-3,pdf,Ruby On Rails,Ruby,Ruby On Rails 3,Pdf,pdf2htmlEX以HTML格式呈现PDF文件。它旨在提供准确的渲染,同时保持Web显示的优化。经过一些演示后,我确信可以使用: 我可以设法安装pdf2htmlEX并在本地将PDF转换为HTML,但是我想在我的rails应用程序中使用它。所以,我找到了克里斯汀·杰姆,正是这个 我担心的是,我缺乏一些知识,使其工作,基本上如何使用这个宝石。这是一份回购协议,其中的用法部分写着该做什么。我关心的一些基本问题: 我到底在哪里存储需要“kristin”?目前它在application.rb中 co

pdf2htmlEX以HTML格式呈现PDF文件。它旨在提供准确的渲染,同时保持Web显示的优化。经过一些演示后,我确信可以使用:

我可以设法安装pdf2htmlEX并在本地将PDF转换为HTML,但是我想在我的rails应用程序中使用它。所以,我找到了克里斯汀·杰姆,正是这个

我担心的是,我缺乏一些知识,使其工作,基本上如何使用这个宝石。这是一份回购协议,其中的用法部分写着该做什么。我关心的一些基本问题:

  • 我到底在哪里存储需要“kristin”?目前它在application.rb中
  • convert(“”,'example.html')。我把这条线存放在哪里?我试过很多方法,但都没有成功
  • 我想在这几个步骤之后,我将在我的应用程序中获得pdf2htmlEX的基本功能


    谢谢

    您现在可能已经找到了一个解决方案,但对于后代,您将
    在需要使用它的.rb文件中要求使用“kristin”
    (尽管如果您将
    gem“kristin”
    添加到您的gem文件中,Bundler应该为您解决这个问题)。然后,您可以继续使用helper方法
    Kristin.convert(…)
    ,只要您需要

    请注意,对于您的生产环境来说,这不是一个“临时”解决方案。您还需要在生产机器上安装pdf2htmlEX(因此kristin示例中的注释:
    #这要求您的路径中存在pdf2htmlEX命令。
    ) 例如,您无法在Heroku这样的托管PaaS上执行此操作


    希望这对某人有所帮助。

    您现在可能已经找到了一个解决方案,但对于后代来说,您将
    在需要使用它的.rb文件中要求使用“kristin”(尽管如果您将
    gem'kristin'
    添加到您的gem文件中,Bundler应该为您解决这个问题)。然后,您可以继续使用helper方法
    Kristin.convert(…)
    ,只要您需要

    请注意,对于您的生产环境来说,这不是一个“临时”解决方案。您还需要在生产机器上安装pdf2htmlEX(因此kristin示例中的注释:
    #这要求您的路径中存在pdf2htmlEX命令。
    ) 例如,您无法在Heroku这样的托管PaaS上执行此操作

    希望这对某人有所帮助。

    CloudConvert()是一项免费/廉价的在线服务,它使用与
    kristin
    gem相同的
    pdf2htmlEX
    (C++)软件,但允许您将PDF(或许多其他文件类型)转换为HTML(或其他)通过一个非常简单的API,而不必在本地机器/生产服务器上安装
    pdf2htmlEX
    。gem
    cloudconvert-ruby
    封装了cloudconvert-API,从而使一切变得非常简单,并且以ruby为中心

    需要预先警告的是,
    pdf2htmlEX
    生成的HTML文档(无论是内联的还是单独的文件[图像、CSS文件、HTML、JS等])具有HTML/CSS结构,在不破坏代码的情况下几乎无法编辑。

    CloudConvert()是一种免费/廉价的在线服务,使用相同的
    pdf2htmlEX
    (C++)作为
    kristin
    gem的软件,但允许您通过非常简单的API将PDF(或许多其他文件类型)转换为HTML(或其他),而无需在本地机器/生产服务器上安装
    pdf2htmlEX
    。gem
    cloudconvert-ruby
    封装了cloudconvert-API,从而使一切变得非常简单,并且以ruby为中心

    需要预先警告的是,
    pdf2htmlEX
    生成的HTML文档(无论是内联的还是在单独的文件[图像、CSS文件、HTML、JS等]中)具有HTML/CSS结构,使得在不破坏代码的情况下几乎无法编辑