实时Web搜索(在.Net中)
你们将如何在.Net平台上创建一个“实时”搜索引擎。现在网络的近实时搜索非常流行,我希望你们能帮我集思广益。我可能最终会尝试制作一些原型,但主要是一种“心理训练” 这些要求是:实时Web搜索(在.Net中),.net,sql-server,search,lucene.net,real-time,.net,Sql Server,Search,Lucene.net,Real Time,你们将如何在.Net平台上创建一个“实时”搜索引擎。现在网络的近实时搜索非常流行,我希望你们能帮我集思广益。我可能最终会尝试制作一些原型,但主要是一种“心理训练” 这些要求是: .NET平台、IIS、MS SQL server或Lucene.NET(文件系统) 要索引的输入数据只是关键字加上一些元信息-不需要进一步处理 数据按关键字分组,并按关键字出现的次数排序 不保留历史数据(超过固定时间的数据被丢弃或移动到其他数据存储) 由于对主题了解不多,到目前为止,我得出了以下结论: 数据通过web服务
Ondrej这个网站并不是真正用于头脑风暴,也不是帮助您设计应用程序 你可能想把这篇文章发到网上,看看这个想法有什么要求和建议,看看实时网络搜索是否有商业意义
但是,您需要确定如何比Google更快。根据您对系统的描述,基本数据库模式可能如下所示: 关键词 -id(主键) -关键字(唯一) 输入 -id(主键) -数据(文本) 输入关键字 -id(主键) -输入\u id(外键) -关键字_id(外键) -计数(整数;id为keyword\u id的关键字在id为input\u id的输入中出现的次数) -过期日期(时间戳;每隔一段时间,所有过期的条目都需要删除) 数据操作如下:
在高流量系统上,您的数据库将经常受到攻击。由于使用数据库实际上只是为了方便跨这些表执行选择操作,而且数据的寿命非常短,因此最好使用内存中的数据结构来替换“关键字”和“输入关键字”表,以消除对磁盘的点击。这可能需要更复杂的应用程序代码,但在繁忙的系统上可能是值得的。您能给出一些您认为类似的站点的示例吗?我想到的站点是。我试图实现的功能是“趋势主题”。我感谢你的意见,但我想你有点误解了我的问题。我不是在问它是否有商业意义,或者我如何能打败谷歌。我只是问,鉴于上述要求,实施此类系统的最佳方式是什么。