你如何处理中间有印地语单词的英文文本?(R中的文本挖掘)

你如何处理中间有印地语单词的英文文本?(R中的文本挖掘),r,text-mining,sentiment-analysis,R,Text Mining,Sentiment Analysis,我正在用R语言进行情感分析,我正在寻找一种有效的方法来处理英语文本中的印地语单词 例如:“我知道,马加,这是可能发生的” 这里的“magar”是一个印地语单词,意思是“但是”。如何处理这种用英语写的多语言文本 谢谢 您可以使用like-soundex来处理词汇表外的术语,并尝试将它们与印地语单词相匹配。然后你把这些独立词翻译成英语。你能提供更多关于你想做什么的信息吗?你想翻译印地语单词,把语料库一分为二吗?计数频率?目标是用英语替换这些用英语书写的印地语单词。我想把印地语单词翻译成英语。我可以从

我正在用R语言进行情感分析,我正在寻找一种有效的方法来处理英语文本中的印地语单词

例如:“我知道,马加,这是可能发生的”

这里的“magar”是一个印地语单词,意思是“但是”。如何处理这种用英语写的多语言文本


谢谢

您可以使用like-soundex来处理词汇表外的术语,并尝试将它们与印地语单词相匹配。然后你把这些独立词翻译成英语。

你能提供更多关于你想做什么的信息吗?你想翻译印地语单词,把语料库一分为二吗?计数频率?目标是用英语替换这些用英语书写的印地语单词。我想把印地语单词翻译成英语。我可以从文件中辨认出一些常见的印地语单词,我想用英语来代替它们。谢谢此外,我正在寻找一些有效的方法来处理此类问题。