Warning: file_get_contents(/data/phpspider/zhask/data//catemap/0/search/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Search 标记和分析搜索查询_Search_Metadata_Nlp_Rdf_Tagging - Fatal编程技术网

Search 标记和分析搜索查询

Search 标记和分析搜索查询,search,metadata,nlp,rdf,tagging,Search,Metadata,Nlp,Rdf,Tagging,我正在开发一个搜索引擎,它的功能考虑了数据的语义,不像通常的基于关键字的索引。我设法使用元数据提取方法和RDF为搜索开发了一个合理的索引,但我在搜索查询本身上使用此类方法时遇到了困难,因为搜索查询比实际数据短得多。您知道如何使用类似的方法、自然语言处理等成功地对搜索查询进行标记吗 谢谢大家! 是的,典型查询的样本量太小,语义分析没有任何价值 一种方法可能是使用“命名实体”或“主谓宾”元组之类的下拉菜单来约束或扩展查询 另一种方法是使用从元数据创建的规则来扩展简单的关键字,例如,可以将对“car”

我正在开发一个搜索引擎,它的功能考虑了数据的语义,不像通常的基于关键字的索引。我设法使用元数据提取方法和RDF为搜索开发了一个合理的索引,但我在搜索查询本身上使用此类方法时遇到了困难,因为搜索查询比实际数据短得多。您知道如何使用类似的方法、自然语言处理等成功地对搜索查询进行标记吗


谢谢大家!

是的,典型查询的样本量太小,语义分析没有任何价值

一种方法可能是使用“命名实体”或“主谓宾”元组之类的下拉菜单来约束或扩展查询

另一种方法是使用从元数据创建的规则来扩展简单的关键字,例如,可以将对“car”的查询扩展为元组模式

(*,[drive,operate,sell],[car,automobile,vehicle])
提交前

最后,您可以尝试使用无语义价值的前缀和/或后缀扩展查询,以获得足够大的查询大小,从而触发OpenCalais的识别器

类似于“用户在查询中指定了以下术语:一、二、三”

返回结果后,过滤掉所有只与添加的前缀/后缀匹配的结果


只是一些简单的想法。

您需要构建语义树。它将基于关键字的组合

例如,汽车-->汽车-->汽车这一关系是汽车的技术方面。旅行--

租车-->车辆-->汽车这与旅行和租车有关。 在这种情况下会对你有很大帮助


你对文件做了什么样的处理?对查询的处理应该在一定程度上反映它,以便搜索工作。我使用了使用OpenCalais()web服务的元数据提取方案,并使用了一个包含两个关键字+rdf子索引的组合索引。但问题是,这些方法无法分析查询,因为查询太短。您好,请您详细解释一下您描述的第一种方法,使用“命名实体”或“主谓宾”元组之类的下拉菜单约束或扩展查询谢谢!当然在“命名实体”的情况下,您可以将语料库中出现的最流行的实体收集到下拉菜单中,当用户选择一个值时,该菜单可用于约束或更好地排列结果。因此,在收到用户的查询后,但在将其提交到搜索引擎之前,可以从下拉列表中添加任何值,格式为元数据。好的,当我得到它时,我让用户在搜索查询中指定标记,可能是使用了我在索引中已经收集的标签列表,并使用它们来了解查询背后的想法。听起来很好,也很简单。我想我也可以让用户指定一些上下文标记,这样我也可以了解搜索的上下文!酷!非常感谢!:)