使用NLP读取SMS信息

使用NLP读取SMS信息,nlp,data-science,Nlp,Data Science,我有一组未分类的SMS消息,我想从中提取与交易相关的消息,然后根据借方或贷方对它们进行分类。我还想提取交易金额、日期和受益人 在NLP中有没有办法解决这个问题?我不想regexp匹配,因为我的SMS数据库可以是多种多样的,包括电子钱包、现金转账、ATM取款、电子资金转账和其他与多个提供商的类似内容 你可以做几件事 检查spacy库,它可以帮助您进行命名实体和货币相关提取。我仍然觉得,如果你谈论的是自动短信,那么最好使用正则表达式来提取这些细节 我不知道你所说的借贷是什么意思 我同意这是一个困难

我有一组未分类的SMS消息,我想从中提取与交易相关的消息,然后根据借方或贷方对它们进行分类。我还想提取交易金额、日期和受益人


在NLP中有没有办法解决这个问题?我不想regexp匹配,因为我的SMS数据库可以是多种多样的,包括电子钱包、现金转账、ATM取款、电子资金转账和其他与多个提供商的类似内容

你可以做几件事

  • 检查spacy库,它可以帮助您进行命名实体和货币相关提取。我仍然觉得,如果你谈论的是自动短信,那么最好使用正则表达式来提取这些细节
  • 我不知道你所说的借贷是什么意思

    • 我同意这是一个困难的问题,因为产生的输入非常复杂。以下是CogCompNLP能够挖掘的关于您输入的信息:

      您可以看到它对日期和组织很敏感

      a) 。交易价值:-500亿美元)。交易类型:-借方c)。时间:- 2017年9月18日15:45)。蛹:-麦当劳餐厅(e)。最终余额:- 41276.00美元)。关联账户:-xxxxxxx 1234

      我要做的是将一系列规则与这些自动提取的标签结合起来。不幸的是,对于这些标签的提取没有100%的保证,但是如果它在99%的示例中都有效,那么它应该足够可靠

      您可以在此处播放演示:


      披露:我是这个软件的作者之一

      很难理解你想写什么。我会帮助你学习英语,但是这个问题太广泛,不适合堆栈溢出。请尝试自己解决问题,只有在遇到特定问题/错误时才来这里,然后以可复制的示例向我们展示代码和数据。@StackOverflows问题询问指南中的Hack-R,并非所有问题都能从包含代码中获益。但是如果你的问题是你写的代码,你应该包括一些。但不要只是复制整个程序!我的语言可能有问题,但我觉得这个问题本身没有问题。你的问题太宽泛,离题,需要一个最小的、完整的、可验证的例子。我投票决定关闭它。我知道你是新来的堆栈溢出,但这是很明显的。请回顾如何提问和MCVE指南。堆栈溢出不是一个论坛。我认为这是一个好问题。你能在阿克沙加上几个例子吗?嗨,丹尼尔,我想我已经找到了使用这些文件的方法。我可以寻找解决办法。谢谢@Shrikar我指的是我储蓄账户的交易信息。