Solr 语义搜索引擎

Solr 语义搜索引擎,solr,search-engine,rdf,sparql,semantic-web,Solr,Search Engine,Rdf,Sparql,Semantic Web,我想为我最后一年的硕士学位设计一个语义搜索引擎。我已经在网上和学术论文上随意阅读了相当多的内容,所以在这个领域我不是一个十足的书呆子 我的目标是构建一个语义搜索引擎,它将HTML内容解析为其等效的RDF三元组,并将三元组存储在一个三元组存储库中,通过该存储库,引擎将尝试响应使用SPARQL触发的查询。我想做一些与众不同的事情。所以,我决定建立一个语义搜索引擎 现在,我有一个正在运行的搜索引擎,使用Solr执行关键字搜索,我想做的是语义搜索。我知道一些关于Web3.0的开源工具,但不确定它们是否与

我想为我最后一年的硕士学位设计一个语义搜索引擎。我已经在网上和学术论文上随意阅读了相当多的内容,所以在这个领域我不是一个十足的书呆子

我的目标是构建一个语义搜索引擎,它将HTML内容解析为其等效的RDF三元组,并将三元组存储在一个三元组存储库中,通过该存储库,引擎将尝试响应使用SPARQL触发的查询。我想做一些与众不同的事情。所以,我决定建立一个语义搜索引擎

现在,我有一个正在运行的搜索引擎,使用Solr执行关键字搜索,我想做的是语义搜索。我知道一些关于Web3.0的开源工具,但不确定它们是否与Solr兼容

那么,你能为我提供一些帮助来建造同样的房子吗

谢谢。
尽管听起来很难,但是你不可能捕捉到所有的东西

  • 你需要大量的数据。当然,已经有很多数据以owl和rdf等格式排列,您可以使用它们(例如WordNet、Yago、GeoNames等),但尽管它们的大小很大,但它们只关注可能的话语世界中非常小的部分

  • 开发一个好的语义搜索需要大量的资源和脑力。例如,德国人工智能研究中心的KompParse项目,只关注人类对话的一小部分(闲聊或购买家具),到目前为止已经运行了好几年,有几名员工参与,但仍然“正常”

  • 理解语义已经在不同的搜索引擎中实现,比如google,或者wolfram alpha。所以这个话题甚至可能不像你想象的那么“开箱即用”


  • 因此,我将使用user723630,并强烈建议您关注一个较小的主题。你仍然会取得很多成就,但你不会感到沮丧。

    首先,你应该澄清或定义“语义搜索”的含义。然后您可以考虑RDF是否可以帮助您实现这一点(或者它可能不会)。尝试在谷歌上搜索“达芬奇之死”。这是“语义搜索”的一个例子吗?如果你问我,我肯定会说是的。这就是你想要实现的吗?在某种程度上,是的。这就是我想要的。谢谢你的回复。我建议你关注地理空间数据,而不是一般的语义搜索。使用谷歌地图并在地图上显示rdf数据。我相信准确地表达你想要达到的目标会更令人印象深刻。从非结构化文档进行完全语义搜索是相当困难的。关注问题的一个子集可能更有益,例如用sparql表达自然语言、从html中提取三元组、评分结果等@user723630----为什么要浪费时间做已经做过的事情呢?:-)