Android 如何在HTML中搜索内容而不是标记

Android 如何在HTML中搜索内容而不是标记,android,html,ios,core-data,windows-phone,Android,Html,Ios,Core Data,Windows Phone,我有一个内容数据库,其中大部分是HTML页面,然后在应用程序中用于显示目的 我们正在寻找建立一个搜索功能,但我有一些担心出现误报,由于结果包括HTML代码 例如,搜索“标题”将返回任何带有标题html标记的内容页 我们目前正在使用NSPredicates对核心数据数据库执行查询 是否有任何简单/有效的方法来防止返回这些结果 我在Windows和Android上也有同样的问题 iOS的一个想法是在HTML版本之外实际存储一个单独的文本版本。然后可以使用非常简单(即使不是非常有效)的谓词 [NSPr

我有一个内容数据库,其中大部分是HTML页面,然后在应用程序中用于显示目的

我们正在寻找建立一个搜索功能,但我有一些担心出现误报,由于结果包括HTML代码

例如,搜索“标题”将返回任何带有标题html标记的内容页

我们目前正在使用NSPredicates对核心数据数据库执行查询

是否有任何简单/有效的方法来防止返回这些结果


我在Windows和Android上也有同样的问题

iOS的一个想法是在HTML版本之外实际存储一个单独的文本版本。然后可以使用非常简单(即使不是非常有效)的谓词

[NSPredicate predicateWithFormat:@"text CONTAINS[cd] %@", searchText]; 
一种更有效的方法是去掉单词,并将它们以小写形式存储在另一个实体的索引属性中

在这两种情况下,都应该事先通过一个可用的库进行解析(参见注释中的链接)