Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/r/80.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
基于R的单段落文本分类_R_Nlp_Text Analysis - Fatal编程技术网

基于R的单段落文本分类

基于R的单段落文本分类,r,nlp,text-analysis,R,Nlp,Text Analysis,我一直在寻找一个解决方案/库或任何函数,它可以对单个段落进行文本分类,而无需任何R方面的培训。我需要对呼叫中心的呼叫数据进行单独分类。呼叫需要根据代理或呼叫方使用的术语进行分类。这些术语可能不是连续的,因此它不遵循二元规则 例如,以下示例文本应归类为“路由器互联网问题” “您好,谢谢您致电XYZ solutions。我是马克。有什么可以帮您的吗?”? 您好,我在连接互联网时遇到了一些问题。我的路由器似乎出现了一些问题。” 我在R中尝试了OpenNLP、RTEXTOOLS库,但不知道如何处理单个段

我一直在寻找一个解决方案/库或任何函数,它可以对单个段落进行文本分类,而无需任何R方面的培训。我需要对呼叫中心的呼叫数据进行单独分类。呼叫需要根据代理或呼叫方使用的术语进行分类。这些术语可能不是连续的,因此它不遵循二元规则

例如,以下示例文本应归类为“路由器互联网问题”

“您好,谢谢您致电XYZ solutions。我是马克。有什么可以帮您的吗?”? 您好,我在连接互联网时遇到了一些问题。我的路由器似乎出现了一些问题。”

我在R中尝试了OpenNLP、RTEXTOOLS库,但不知道如何处理单个段落。有人有什么想法吗?感谢您的帮助

已编辑
由于我是R方面的初学者,所以如果可能的话,我非常希望有一个彻底的解决方案

看起来您正试图从文档中提取内容,并将其用作标记/标签。您可能想看看这个R包{RKEA}-

这看起来是一个非常广泛的问题。你试了什么?请添加代码行,包括示例数据-准备复制粘贴在R中运行以进行复制。您可以创建一个包含所有唯一类别的向量吗?另一方面,您可以创建一个包含关键字的向量,并使用该向量从每个段落中提取这些关键字(如果有的话)@lukeA,非常广泛!感谢您的回复,LukeA我在这里尝试了RTextTools提供的解决方案:Sotos,正如我提到的,我在R中是一个幼稚的人,所以我不能这样做。你能提出其他解决办法吗?