Python R拼写检查器/标记器

Python R拼写检查器/标记器,python,r,Python,R,我不确定R是不是一个合适的地方来尝试这个,但这是我的情况。我有一个充满字符串的字符向量 id Words 1 'The' 2 'victory' 3 'wasgreat' ... ... 原始数据存在一些编码问题,一些字符串是几个单词的组合: (ie 'My name is' -> 'Mynameis'). 我需要把正确的单词放在一边,把拼错的复合词分成正确的子串 我很好奇R中是否有处理此类问题的设置。我认为python中有几个程序可以更好地处理这个

我不确定R是不是一个合适的地方来尝试这个,但这是我的情况。我有一个充满字符串的字符向量

id    Words
 1    'The'
 2    'victory'
 3    'wasgreat'
...   ...
原始数据存在一些编码问题,一些字符串是几个单词的组合:

 (ie 'My name is' -> 'Mynameis').
我需要把正确的单词放在一边,把拼错的复合词分成正确的子串

我很好奇R中是否有处理此类问题的设置。我认为python中有几个程序可以更好地处理这个问题,但我的python技能却非常弱(几乎不存在)。但是,我愿意把它看作是一种选择。< /P>
有什么建议吗?

最新一期的有一个,递归到解救,它们适用于R源本身。

我整天都在想如何让aspell在Windows 7 x64上使用自定义词典。尝试了saveRDS()函数和aspell\u write\u personal\u dictionary\u file()函数。对于前者,我收到一个错误“单词“UTF-8”无效。字符“-”可能不会出现在单词的中间。”以及一个警告。后来aspell找不到我的自定义词典。你知道如何攻击它吗?