如何在没有php的情况下从mysql结果中删除html标记和php序列化信息?

如何在没有php的情况下从mysql结果中删除html标记和php序列化信息?,php,mysql,html,sphinx,Php,Mysql,Html,Sphinx,我正在存储一个PHP数组,其中key=>value对是用于在网站上构建jQueryUI选项卡的信息 存储在MySQL数据库中的字符串如下所示: a:2:{i:0;a:2:{i:1;s:9:“信息”;i:2;s:643:本节是关于foo的。知识产权…”;}i:1;a:2:{i:1;s:14:“更多信息”;i:2;s:465:知识产权…” (不是有效的序列化数组或html,因为我出于格式化原因截断了冗长的内容) 我想允许将这些内容提供给Sphinx(全文索引器),用于网站搜索。基本上,Sphinx只

我正在存储一个PHP数组,其中key=>value对是用于在网站上构建jQueryUI选项卡的信息

存储在MySQL数据库中的字符串如下所示:

a:2:{i:0;a:2:{i:1;s:9:“信息”;i:2;s:643:本节是关于foo的。知识产权…”;}i:1;a:2:{i:1;s:14:“更多信息”;i:2;s:465:知识产权…”

(不是有效的序列化数组或html,因为我出于格式化原因截断了冗长的内容)


我想允许将这些内容提供给Sphinx(全文索引器),用于网站搜索。基本上,Sphinx只是获取数据库的内容,并根据您指定的配置选项为它找到的内容编制索引。。。我想知道的是,是否有一种好方法可以让MySQL或Sphinx去掉序列化信息和html标记,这样只有纯文本被索引。

最好的办法可能是停止存储PHP序列化格式,在Sphinx可以索引的旁边添加一个“纯文本”版本。如果做不到这一点,另一个想法是使用PHP脚本定期对表进行爬网,并使用创建记录的原始HTTP请求创建带外的“纯文本”版本。使用unserialize()和strip_tags(),这将成为一个相当简单的问题。

对于Html标记问题,请将其放入sphinx配置中: html_strip=1


我没有找到从索引中删除序列化信息的方法。(但我也有同样的问题)

是的,当我在这个项目中达到这一点时,我正打算依靠这个。我正在使用的CMS使得在序列化字符串旁边存储纯文本有点痛苦,但我会找到一些工作。很好的发现,以前从未见过。我想我已经找到了一种方法,在我使用的CMS中,在DB中存储一个纯文本替代文本,与原始文本一起存储,但这是一个非常好的提示。