我怎么能不剥离sphinx属性中的html?

我怎么能不剥离sphinx属性中的html?,sphinx,exist-db,Sphinx,Exist Db,我有一个exist db数据库,其中有两个大的TEI xml文件,我想对它们进行索引/搜索。对于索引,我有一个xmlpipe2命令调用existdb提供的sphinx-out.xql url。除了实际的文本片段、段落、标题、注释等,这还提供了几个属性,我稍后在显示搜索结果时要使用这些属性。其中一个是包含html的crumbtrail字段,更准确地说,它包含一系列超链接 由于我希望能够在搜索中提供句子和段落运算符,所以我设置了index_sp=1,因为这反过来需要html剥离,所以我还设置了htm

我有一个exist db数据库,其中有两个大的TEI xml文件,我想对它们进行索引/搜索。对于索引,我有一个xmlpipe2命令调用existdb提供的sphinx-out.xql url。除了实际的文本片段、段落、标题、注释等,这还提供了几个属性,我稍后在显示搜索结果时要使用这些属性。其中一个是包含html的crumbtrail字段,更准确地说,它包含一系列超链接

由于我希望能够在搜索中提供句子和段落运算符,所以我设置了index_sp=1,因为这反过来需要html剥离,所以我还设置了html_strip=1。但这似乎也从我的属性中剥离了html,我想保留这些属性

下面是sphinx.out.xql和xmlpipe2命令给出的内容:

现在我想知道是否有任何方法可以禁用属性的html剥离

至少有人能确认在sphinx属性中存储html是可能的吗

感谢您提供的任何见解

是否可以使用html\u index\u attrs以便不删除跨距和a


html\u index\u attrs=span=class,a=href

您确定需要索引吗?短语搜索不需要它。我非常了解eXist db,但这个问题似乎是专门针对斯芬克斯的,还是我遗漏了什么?@adamretter,是的,我认为让斯芬克斯做我想做的是更明显的方法。我只是想把一切都摆在桌面上,也许我应该从另一个角度来看待这个问题。例如,我尝试过的一种方法是base64编码crumbtrail html,这样sphinx甚至不会查看内部。但事实证明,我认为eXist的util:base64 encode也只对实际的文本/字符串内容进行编码,不管发生什么情况,都会剥离html,所以我不再深入了。@barryhunter,对不起,我被搞糊涂了。我的意思是我想提供句子和段落操作符。Tbh,我还不知道我是否真的需要它,但听起来确实不错。我试过使用html\u index\u attrs=span=class;a=href,甚至使用index_sp=0和html_strip=0,但仍然没有在属性中获取html。我做错什么了吗?有人在sphinx属性中成功使用过html吗?这没有帮助。然后再次强调,什么都没有,甚至禁用html_-strip,所以我开始怀疑我是否做错了什么。。。
<sphinx:docset>
<sphinx:document id="77">
  <sphinx_docid>77</sphinx_docid>
  <sphinx_work>W0013</sphinx_work>
  <sphinx_author>Vitoria, Francisco de</sphinx_author>
  <sphinx_title>Relectiones</sphinx_title>
  <sphinx_year>1557</sphinx_year>
  <sphinx_crumbtrail>
    <span class="crumbtrail">
      <a href="/exist/apps/salamanca/work.html?wid=W0013#Vol02">Vol. 2</a>
      <span class="tokenizer"> &gt; </span>
      <a href="/exist/apps/salamanca/work.html?wid=W0013#Vol02Lect01">De augmento charitatis</a>
    </span>
  </sphinx_crumbtrail>
  <sphinx_description>
    <p xmlns="http://www.tei-c.org/ns/1.0" xml:id="p_l3w_pml_y4">
      [SNIP]
    </p>
  </sphinx_description>
</sphinx:document>
 .
 .
 .
</sphinx:docset>
mysql> select sphinx_docid, sphinx_work, sphinx_crumbtrail from salamanca_base;
+------+--------+--------------+-------------+---------------------------------+
| id   | weight | sphinx_docid | sphinx_work | sphinx_crumbtrail               |
+------+--------+--------------+-------------+---------------------------------+
  .
  .
  .
|   77 |      1 |           77 | W0013       | Vol. 2 > De augmento charitatis |
+------+--------+--------------+-------------+---------------------------------+
20 rows in set (0.00 sec)