Web crawler 如何查找任何给定实体的URL和图像?

Web crawler 如何查找任何给定实体的URL和图像?,web-crawler,data-mining,Web Crawler,Data Mining,我正在做一些web挖掘的工作,并试图找到某些特定实体的web URL(例如,wikipedia页面和主页)。实体指的是一些球员的姓名、位置等。例如,如果我的输入是大卫·贝克汉姆,我希望以下内容作为输出: Url结果: 图像结果如下: 有人能指出实现这一点的方法吗?是的,非常简单: 你只需要实现一个搜索引擎,比如谷歌。然后你可以搜索名字,它会给你你想要的结果 我假装这对别人可能有帮助。有几种语义Web实现在查找实体信息时非常有用。我发现dbpedia(wikipedia的语义web表示)非常

我正在做一些web挖掘的工作,并试图找到某些特定实体的web URL(例如,wikipedia页面和主页)。实体指的是一些球员的姓名、位置等。例如,如果我的输入是大卫·贝克汉姆,我希望以下内容作为输出:

Url结果:

图像结果如下:

有人能指出实现这一点的方法吗?

是的,非常简单:


你只需要实现一个搜索引擎,比如谷歌。然后你可以搜索名字,它会给你你想要的结果

我假装这对别人可能有帮助。有几种语义Web实现在查找实体信息时非常有用。我发现dbpedia(wikipedia的语义web表示)非常有用,虽然有一些陡峭的学习曲线,如SPARQL、RDFs,但它是值得和令人兴奋的。

不需要编写搜索引擎,dbpedia spotlight可以用来解决这个问题。