用于分析文本的TSQL查询

用于分析文本的TSQL查询,sql,regex,tsql,fuzzy-comparison,Sql,Regex,Tsql,Fuzzy Comparison,我有一张表,上面有订单号、取消日期和原因。 原因字段是varchar(255)字段,由许多不同的销售代表编写,很难按原因类别进行分组。我需要生成一份报告来对取消原因进行分类。用TSQL分析原因的最佳方法是什么 销售代表输入的原因示例 cust already has this order going out cust can not hold for item Called to cancel order cust doesn't want to pay for shipping wife or

我有一张表,上面有订单号、取消日期和原因。 原因字段是varchar(255)字段,由许多不同的销售代表编写,很难按原因类别进行分组。我需要生成一份报告来对取消原因进行分类。用TSQL分析原因的最佳方法是什么

销售代表输入的原因示例

cust already has this order going out
cust can not hold for item Called to cancel order
cust doesn't want to pay for shipping
wife ordered same item from different vendor, sent email
cst made a duplicate order, sent email
cst can't hold
Cust doesn't want to go through verification process so is cancelling order
doesn't ant to hold  for Bo
doesn't want
Cust called to cancel the order  He can no longer get the product he wants 
cnt hld
will not comply with export req
cant' hold
Custs request
Cust will not hold for BO
per. cust. request.

顺便说一句,我有SQL Server 2005。

您的部分问题在于,这不是真正的原因码。我觉得你的模式有问题。如果没有预定义的原因代码可供参考,并且您允许为每个原因输入自由文本,那么除了将不同的原因拉回来(这可能不会非常有用)之外,实际上没有直接这样做的方法

这只是一个想法,您是否可以向表中添加另一列,即使它处于临时或测试环境中,然后让业务用户能够为每个订单取消分配代码(例如,1用于mis发货,2用于重复订单,3用于错误项目等)。然后对其进行分析

我想这就是他们对你的期望,但我不知道我有没有更好的办法。如果你有权威/知识,你可以自己进行分析,但如果你有大量的取消,这可能会很痛苦


编辑-我现在看到你已经用正则表达式标记了这个。。。可以设置指定的关键字来提取条目,但是必须有一些内置的公差,并且对于由于拼写错误等而不属于任何指定类别的项目,之后仍然需要手动分析。/edit

问题的一部分是,这些不是真正的原因码。我觉得你的模式有问题。如果没有预定义的原因代码可供参考,并且您允许为每个原因输入自由文本,那么除了将不同的原因拉回来(这可能不会非常有用)之外,实际上没有直接这样做的方法

这只是一个想法,您是否可以向表中添加另一列,即使它处于临时或测试环境中,然后让业务用户能够为每个订单取消分配代码(例如,1用于mis发货,2用于重复订单,3用于错误项目等)。然后对其进行分析

我想这就是他们对你的期望,但我不知道我有没有更好的办法。如果你有权威/知识,你可以自己进行分析,但如果你有大量的取消,这可能会很痛苦


编辑-我现在看到你已经用正则表达式标记了这个。。。可以设置指定的关键字来提取条目,但是必须有一些内置的容差,并且对于由于拼写错误等原因不属于任何指定类别的项目,之后仍然需要手动分析。/edit

+1至@jmatthews,您确实需要选择原因代码,然后可能允许自由形式输入完整原因


如果这不是一个选项,你可以考虑。不过,不要指望这会很快或很容易,这仍然是一个开放的研究课题,与人工智能和机器学习都有关。

+1到@jmatthews,你真的需要选择原因代码,然后可能允许自由形式输入完整的原因


如果这不是一个选项,你可以考虑。不过,不要指望这会很快或很容易,它仍然是一个开放的研究主题,与人工智能和机器学习都相关。

查看SSIS中的术语查找,阅读。

查看SSIS中的术语查找,阅读。

谢谢。我想了想。但问题是我们使用第三方订单处理应用程序,我们将无法设置原因列表。但我可以在表格上添加额外的列,但问题仍然是一样的。谢谢。我想了想。但问题是我们使用第三方订单处理应用程序,我们将无法设置原因列表。但我可以在表中添加额外的列,但问题仍然是一样的。