Ruby on rails 使用RubyonRails、Sphinx或UltraSphinx以及HTML源代码(不是数据库)

Ruby on rails 使用RubyonRails、Sphinx或UltraSphinx以及HTML源代码(不是数据库),ruby-on-rails,sphinx,ultrasphinx,Ruby On Rails,Sphinx,Ultrasphinx,斯芬克斯-0.9.9-rc2的文件规定: 要编制索引的数据通常可以来自非常不同的来源:SQL 数据库、纯文本文件、HTML文件、邮箱等 但是,除了SQL之外,我找不到任何关于设置源代码的文档。配置文件似乎并不表示源可以是数据库以外的任何东西。任何人都有关于使用HTML源设置sphinx的有用链接吗?您是否正在寻找sphinx上的(现在称为xmlpipe2)功能?我已经在XML文件中试用过,它的工作原理与SQL一样 我还没有用普通HTML文件试用Sphinx,所以我猜您需要解析HTML文件,创建包

斯芬克斯-0.9.9-rc2的文件规定:

要编制索引的数据通常可以来自非常不同的来源:SQL 数据库、纯文本文件、HTML文件、邮箱等

但是,除了SQL之外,我找不到任何关于设置源代码的文档。配置文件似乎并不表示源可以是数据库以外的任何东西。任何人都有关于使用HTML源设置sphinx的有用链接吗?

您是否正在寻找sphinx上的(现在称为xmlpipe2)功能?我已经在XML文件中试用过,它的工作原理与SQL一样

我还没有用普通HTML文件试用Sphinx,所以我猜您需要解析HTML文件,创建包含您想要索引的属性/字段的XML文件,并使用xmlpipe将它们提供给Sphinx

你可以看到更多


HTH

不,我特别想读入html文件,为它们编制索引,然后用它为我的网站构建搜索引擎。我已经放弃尝试使用斯芬克斯,而是从另一个角度来解决这个问题。以下是我能找到的最新信息,供其他人参考: