R 在Quanteda中标记文本并使用字典进行分析

R 在Quanteda中标记文本并使用字典进行分析,r,quanteda,R,Quanteda,我正在尝试使用R中的quanteda软件包进行文本分析,并成功地获得了所需的输出,而无需对我的文本做任何处理。然而,我感兴趣的是删除stopwords和其他常用短语以重新运行分析(根据我在其他来源中学习的内容——这个过程称为“标记化”(?)。(说明来自) 通过处理后的文本,我可以使用说明和quanteda包来完成。然而,我对使用字典来分析文本感兴趣。我该怎么做?由于很难将我所有的文件都附在这里,因此我可以应用的任何提示或示例都将非常有用,非常感谢 谢谢大家! 我非常成功地使用了这个库,然后通过w

我正在尝试使用R中的
quanteda
软件包进行文本分析,并成功地获得了所需的输出,而无需对我的文本做任何处理。然而,我感兴趣的是删除stopwords和其他常用短语以重新运行分析(根据我在其他来源中学习的内容——这个过程称为“标记化”(?)。(说明来自)

通过处理后的文本,我可以使用说明和
quanteda
包来完成。然而,我对使用字典来分析文本感兴趣。我该怎么做?由于很难将我所有的文件都附在这里,因此我可以应用的任何提示或示例都将非常有用,非常感谢


谢谢大家!

我非常成功地使用了这个库,然后通过word进行合并以获得分数或情感。逐字合并

library(tidytext)

get_sentiments("afinn")
get_sentiments("bing")
您可以将其另存为表

table <- get_sentiments("afinn")

total <- merge(data frameA,data frameB,by="ID")

table我非常成功地使用了这个库,然后通过word进行合并以获得分数或情绪。逐字合并

library(tidytext)

get_sentiments("afinn")
get_sentiments("bing")
您可以将其另存为表

table <- get_sentiments("afinn")

total <- merge(data frameA,data frameB,by="ID")

询问教程或示例的表格是离题的。但是请看一下主页,特别是示例部分。感谢您提供此链接。然而,我提出了这个问题,因为我已经这样做了。从本质上说,我不是在要求一个教程,而是一些有用的提示,可以帮助我达到我想要的目的。在我发帖之前,我在网上查阅了相关的线索和人们已经完成的项目,但没有什么是非常有帮助的。谢谢!如果这有点愚蠢,我很抱歉,但对于输出来说,这些值是百分比还是出现次数?询问教程或示例是离题的。但是请看一下主页,特别是示例部分。感谢您提供此链接。然而,我提出了这个问题,因为我已经这样做了。从本质上说,我不是在要求一个教程,而是一些有用的提示,可以帮助我达到我想要的目的。在我发帖之前,我在网上查阅了相关的线索和人们已经完成的项目,但没有什么是非常有帮助的。谢谢!如果这有点愚蠢,我很抱歉,但是对于输出,这些值是百分比还是出现次数?