Indexing 制作搜索引擎最简单的工具是什么?

Indexing 制作搜索引擎最简单的工具是什么?,indexing,web-crawler,search-engine,facet,Indexing,Web Crawler,Search Engine,Facet,我想建立一个搜索引擎,可以抓取一个网站,比如说,或者一个列出某种产品或服务的网站,索引相关信息,然后能够执行分面搜索 我尝试使用Nutch和Solr,但我坚持只为相关信息编制索引,而不是整个网页,并在字段中编制索引。我现在正试图用一个简单的方法来解析html页面,但我不擅长web内容,我想知道是否有更简单的方法 我不是在寻找最佳解决方案。Windows已经内置了搜索引擎。从NT4到WinXP有索引服务,从WinXP到Win8有Windows桌面搜索,它们都可以配置为索引任意内容,包括远程站点。您

我想建立一个搜索引擎,可以抓取一个网站,比如说,或者一个列出某种产品或服务的网站,索引相关信息,然后能够执行分面搜索

我尝试使用Nutch和Solr,但我坚持只为相关信息编制索引,而不是整个网页,并在字段中编制索引。我现在正试图用一个简单的方法来解析html页面,但我不擅长web内容,我想知道是否有更简单的方法


我不是在寻找最佳解决方案。

Windows已经内置了搜索引擎。从NT4到WinXP有索引服务,从WinXP到Win8有Windows桌面搜索,它们都可以配置为索引任意内容,包括远程站点。您所要做的就是配置源,确保索引已完成,然后使用查询引擎进行搜索

或者,MSSQL server自2005版起就内置了全文搜索功能。自MSSQL 2008以来,已经内置了HTML过滤器


或者,如果你不喜欢Windows,有很多第三方解决方案可用,既有免费的,也有商业的。我对它们都没有经验,所以不能推荐它们。

Scrapy python工具有助于抓取和刮取。您可以将产品刮取为json结构,然后在elasticsearch中编制索引。 大多数OSS工具都要求你把手弄脏(即编程)

附言:你需要的不仅仅是搜索:请编辑标题“什么是最简单的工具抓取、刮取、索引和搜索”