Dictionary 拼音,取消咀嚼-转储整个字典,编码错误

Dictionary 拼音,取消咀嚼-转储整个字典,编码错误,dictionary,encoding,hunspell,Dictionary,Encoding,Hunspell,我想要一本拼写词典 我找到了解决方案:unmunch/usr/share/hunspell/pl\u pl.dic/usr/share/hunspell/pl\u pl.aff 但是编码有问题 部分输出: ambasadorowaniom ambasadorowaniach ambasadorowa� ambasadoruj�cy ambasadoruj�cym 我也尝试过使用iconv过滤输出,但问题没有解决: affix: z�c� 4, strip: �� 2 affix:

我想要一本拼写词典

我找到了解决方案:
unmunch/usr/share/hunspell/pl\u pl.dic/usr/share/hunspell/pl\u pl.aff

但是编码有问题

部分输出:

ambasadorowaniom
ambasadorowaniach
ambasadorowa�
ambasadoruj�cy
ambasadoruj�cym
我也尝试过使用iconv过滤输出,但问题没有解决:

   affix: z�c� 4, strip: �� 2
   affix: z�ce 4, strip: �� 2
   affix: z�cej 5, strip: �� 2
stable 50 num is 470 flag G
parsing line: MAP 8
parsing line: MAP a�
parsing line: MAP c�
如何解决此问题?

简短版本: 您的控制台终端有问题。将其更改为另一个,如xterm

更长: 奇怪。它应该是UTF8。您确定这不是由于您的控制台或终端不支持UTF8造成的吗?在任何支持UTF8的图形编辑器中检查结果。并检查您的区域设置

免责声明:
我想帮忙。但是,由于我不能评论任何东西(1个信誉点),请求澄清或向用户发送消息,我必须提供任何答案(在我的答案中)以不被删除。

如果您仍然想知道如何解决这个问题(我今晚碰到了这个问题),或者,如果将来有人会拥有它,请看这里-iconv解决了这个问题-字典文件似乎是用iso-latin-2编码的:

unmunch pl_PL.dic pl_PL.aff 2>/dev/null | iconv -f iso-8859-2 -t utf

对我是韦里德。我的语言环境是LANG=en_US.UTF-8,我的终端(gnome终端)支持utf8:)我实际上没有解决这个问题。但我只是用了aspell而不是hunspell。小的解决方法。在一些字典的情况下,它可能是先前转换为UTF8的工件。例如,《澳大利亚词典》中有一些错误,比如几年前出现错误转换时的Foré(10万个单词中只有200个受到影响),但实际上,该错误已在最新版本的词典中得到修复。@MateuszJagieło您是如何使用aspell的?2>/dev/null意味着什么?@MonsterMMORPG,这意味着“将stderr重定向到/dev/null”