存储在文件系统中的文档在ASP.Net应用程序中需要进行文本搜索和筛选
我们正在构建一个工作站点应用程序,其中我们将存储所有应聘者的简历,并计划存储在文件系统中 现在我们需要在该文件中搜索并向用户提供结果,我们需要提供实现文本搜索的最佳解决方案 我刚刚尝试识别它,并获得了一些参考资料,如IFilter(API或接口)和Lucene.Net(开源),但不确定它是否是一个正确的解决方案 在最初阶段,预计大约有50000份简历,如果数量增加,它应该具有足够的可扩展性 我只想做一些案例研究,或者做一些分析,或者你的建议,哪种方法是处理这个需求的最佳方法(技术ASP.Net) 谢谢您可以使用。有一个免费的版本,所以你可以在购买前试用(或者如果它符合你的要求,永远不要购买)存储在文件系统中的文档在ASP.Net应用程序中需要进行文本搜索和筛选,asp.net,indexing,search-engine,Asp.net,Indexing,Search Engine,我们正在构建一个工作站点应用程序,其中我们将存储所有应聘者的简历,并计划存储在文件系统中 现在我们需要在该文件中搜索并向用户提供结果,我们需要提供实现文本搜索的最佳解决方案 我刚刚尝试识别它,并获得了一些参考资料,如IFilter(API或接口)和Lucene.Net(开源),但不确定它是否是一个正确的解决方案 在最初阶段,预计大约有50000份简历,如果数量增加,它应该具有足够的可扩展性 我只想做一些案例研究,或者做一些分析,或者你的建议,哪种方法是处理这个需求的最佳方法(技术ASP.Net)
如果以后确实要将这些文档集成到Sharepoint门户中,企业搜索也可以与之集成。一种可能是使用SQL Server 2008中的
FILESTREAM
功能,并结合数据库级全文索引/搜索
这将允许您将文件保存在文件系统中,同时还提供事务完整性和搜索
SQL Express支持
FILESTREAM
,4GB大小限制不适用于文件(尽管它适用于全文索引的大小)。这可能是幼稚的,因为我不熟悉现成的搜索产品,但如果没有任何预构建符合要求,我将构建一个简单的服务来爬网和索引(或多个实例来抓取不同的目录以提高速度)并更新数据库。如果定期访问这些文件,则可以构建隔离层以防止冲突
Rodney我希望您为此使用sharepoint WSS 3.0不提供内容搜索功能(MOSS因定价超出范围)在任何情况下,我们都在asp.net中开发了我们的网站,并希望有一个可以与之集成的工具。可以将search server express与我们的自定义应用程序集成。如果是,您可以为其提供任何链接。您可以通过API创建自定义连接器;查看这些可用于生产的连接器: