C# 类别匹配-正则表达式与全文搜索

C# 类别匹配-正则表达式与全文搜索,c#,sql,sql-server-2008,C#,Sql,Sql Server 2008,我有一个相当大的分类表,其中有1500个分类(一些单数单词,其他包含多个),我正在寻找将新产品按标题与这些分类相匹配的最佳方法 我一直在考虑使用正则表达式并在产品描述中循环查找关键字,但如果一次添加1000多个产品,这将不是非常有效,我也一直在考虑全文搜索(FREETEXT和contains)但FreeText搜索似乎带来了很多结果,因为它匹配了产品描述中的所有单词 有没有人做过类似的事情,试图根据产品描述自动确定产品的类别,并提供一些建议或指针 我理解的问题是,给出一个描述,告诉我这个描述适用

我有一个相当大的分类表,其中有1500个分类(一些单数单词,其他包含多个),我正在寻找将新产品按标题与这些分类相匹配的最佳方法

我一直在考虑使用正则表达式并在产品描述中循环查找关键字,但如果一次添加1000多个产品,这将不是非常有效,我也一直在考虑全文搜索(FREETEXT和contains)但FreeText搜索似乎带来了很多结果,因为它匹配了产品描述中的所有单词


有没有人做过类似的事情,试图根据产品描述自动确定产品的类别,并提供一些建议或指针

我理解的问题是,给出一个描述,告诉我这个描述适用于哪一类

完成这类工作的一种常用方法是构建一个流程,并将所有描述贯穿其中

这样的分类通常分两个阶段进行

阶段1:使用已知描述/类别对“训练”分类器

阶段2:一旦分类器被训练,你就可以给它未知的数据,然后它将返回一个概率,说明将匹配一个给定的类别

这种方法中的分类器通常非常准确,但如果我们处理的是统计数据,错误通常会悄悄出现