R 如何用文本替换表情符号并将其视为单个单词?

R 如何用文本替换表情符号并将其视为单个单词?,r,emoji,topic-modeling,data-preprocessing,R,Emoji,Topic Modeling,Data Preprocessing,我必须基于包含带有R的表情符号的文本片段进行主题建模。使用replace_emoji()和replace_emoticon函数,我可以分析它们,但结果有问题 红心表情符号被翻译为“红心ufef”。在分析过程中,这些词会被单独处理,并影响结果 像“心”这样的词可以有一个非常不同的含义,就像“红心ufef”和“破碎的心”一样 函数replace\u emoji\u identifier()也没有帮助,因为标识符使分析变得困难 可使用dput()复制的虚拟数据集(包括步骤强制小写: 表情符号结构答案

我必须基于包含带有R的表情符号的文本片段进行主题建模。使用
replace_emoji()
replace_emoticon
函数,我可以分析它们,但结果有问题

红心表情符号被翻译为“红心ufef”。在分析过程中,这些词会被单独处理,并影响结果

像“心”这样的词可以有一个非常不同的含义,就像“红心ufef”和“破碎的心”一样 函数
replace\u emoji\u identifier()
也没有帮助,因为标识符使分析变得困难

可使用
dput()
复制的虚拟数据集(包括步骤
强制小写


表情符号结构答案

Replace_emoji
中的默认转换表替换为删除空格/标点符号的版本:


适用于虚拟数据集的
hash2。问题是我得到了一个混合了文本和表情的列表。您的代码在那里不起作用,或者我无法让它起作用,因为它在数据[,1]中返回
错误:维数不正确
你有解决方案吗?你能提供一个新的虚拟集更好地表示实际数据吗?好了。这应该可以解决问题了…你的解决方案将所有单词变成一个大单词,R不允许我将其拆分成单词…我也不太明白如何使用
l在您的解决方案中应用
。我根据新的要求更新了答案,并就如何实现新的表情符号提出了建议。谢谢。:)这正是我想要的。