基于R的单段落文本分类
我一直在寻找一个解决方案/库或任何函数,它可以对单个段落进行文本分类,而无需任何R方面的培训。我需要对呼叫中心的呼叫数据进行单独分类。呼叫需要根据代理或呼叫方使用的术语进行分类。这些术语可能不是连续的,因此它不遵循二元规则 例如,以下示例文本应归类为“路由器互联网问题” “您好,谢谢您致电XYZ solutions。我是马克。有什么可以帮您的吗?”? 您好,我在连接互联网时遇到了一些问题。我的路由器似乎出现了一些问题。” 我在R中尝试了OpenNLP、RTEXTOOLS库,但不知道如何处理单个段落。有人有什么想法吗?感谢您的帮助 已编辑基于R的单段落文本分类,r,nlp,text-analysis,R,Nlp,Text Analysis,我一直在寻找一个解决方案/库或任何函数,它可以对单个段落进行文本分类,而无需任何R方面的培训。我需要对呼叫中心的呼叫数据进行单独分类。呼叫需要根据代理或呼叫方使用的术语进行分类。这些术语可能不是连续的,因此它不遵循二元规则 例如,以下示例文本应归类为“路由器互联网问题” “您好,谢谢您致电XYZ solutions。我是马克。有什么可以帮您的吗?”? 您好,我在连接互联网时遇到了一些问题。我的路由器似乎出现了一些问题。” 我在R中尝试了OpenNLP、RTEXTOOLS库,但不知道如何处理单个段
由于我是R方面的初学者,所以如果可能的话,我非常希望有一个彻底的解决方案看起来您正试图从文档中提取内容,并将其用作标记/标签。您可能想看看这个R包{RKEA}-这看起来是一个非常广泛的问题。你试了什么?请添加代码行,包括示例数据-准备复制粘贴在R中运行以进行复制。您可以创建一个包含所有唯一类别的向量吗?另一方面,您可以创建一个包含关键字的向量,并使用该向量从每个段落中提取这些关键字(如果有的话)@lukeA,非常广泛!感谢您的回复,LukeA我在这里尝试了RTextTools提供的解决方案:Sotos,正如我提到的,我在R中是一个幼稚的人,所以我不能这样做。你能提出其他解决办法吗?