西班牙语的tidytext R-有其他选择吗?
我在twitter上做情绪分析,但我的tweet是西班牙语的,所以我不能用tidytext对单词进行分类。有人知道西班牙语是否也有类似的软件包吗?不幸的是,目前在非英语语言中没有很多好的情感词汇开源选项。您可以向作者请求使用其他语言编写的文档;它是由谷歌翻译公司翻译的(这当然增加了不确定性,但总体来说基本上还可以),作者说,他们将其用于研究目的,但将收取商业使用费用。我在非英语文本挖掘方面也遇到了同样的问题。我找到了西班牙语的tidytext R-有其他选择吗?,r,sentiment-analysis,tidytext,R,Sentiment Analysis,Tidytext,我在twitter上做情绪分析,但我的tweet是西班牙语的,所以我不能用tidytext对单词进行分类。有人知道西班牙语是否也有类似的软件包吗?不幸的是,目前在非英语语言中没有很多好的情感词汇开源选项。您可以向作者请求使用其他语言编写的文档;它是由谷歌翻译公司翻译的(这当然增加了不确定性,但总体来说基本上还可以),作者说,他们将其用于研究目的,但将收取商业使用费用。我在非英语文本挖掘方面也遇到了同样的问题。我找到了udpipe,这是Bnosac开发的一个r包。它是一个自然语言处理工具包,提供与
udpipe
,这是Bnosac开发的一个r包。它是一个自然语言处理工具包,提供与语言无关的原始文本“标记化”、“词性标记”、“柠檬化”、“形态特征标记”和“依赖性解析”。请注意,包中没有情绪标签。那些你需要在别处找到的
它支持多种非英语语言
您可以在他们的网站、的网页或上找到更多信息
另外,我与他们没有任何关系。斯坦福核心NLP软件包在cran上,并且还通过get_情绪功能为西班牙语提供情绪功能可能不是最佳选择,但我建议使用
translateR
软件包翻译成英语,然后使用tidytext进行分类。但是如果你控制一点机器学习算法。文本聚类有几种算法。