Utf 8 还原utf8格式的发音符号-Linux

Utf 8 还原utf8格式的发音符号-Linux,utf-8,text-files,restore,diacritics,Utf 8,Text Files,Restore,Diacritics,我有几个文本文件,里面都是这样的句子:“Mais,tu n'as pas fait tes devoirs?!”——\u00c9l\u00e8ve:“Ben non” 是否有一种快速方法(脚本或实用程序)以utf8格式恢复所有的发音符号?(预期结果:埃列夫:“本·农”) 我可以用sed手动完成,但由于我的文本文件包含几种语言特有的发音符号,这将花费太多时间 非常感谢我找到了 python -c "print (open('filetoconvert.txt','rb').read().decod

我有几个文本文件,里面都是这样的句子:“Mais,tu n'as pas fait tes devoirs?!”——\u00c9l\u00e8ve:“Ben non”

是否有一种快速方法(脚本或实用程序)以utf8格式恢复所有的发音符号?(预期结果:埃列夫:“本·农”)

我可以用sed手动完成,但由于我的文本文件包含几种语言特有的发音符号,这将花费太多时间

非常感谢

我找到了

python -c "print (open('filetoconvert.txt','rb').read().decode('unicode-escape').encode('utf-8'))"
我找到了

python -c "print (open('filetoconvert.txt','rb').read().decode('unicode-escape').encode('utf-8'))"

如果您安装了Java JDK,则有一个名为
native2ascii
的实用程序,用于将文件转换为unicode转义码和从unicode转义码转换文件。例如:

native2ascii -reverse filetoconvert.txt > converted.txt

如果您安装了Java JDK,则有一个名为
native2ascii
的实用程序,用于将文件转换为unicode转义码和从unicode转义码转换文件。例如:

native2ascii -reverse filetoconvert.txt > converted.txt

哪些(脚本)语言可以访问/使用?Shell脚本,仅此而已。。我是个十足的新手。这就是为什么我想知道是否有现成的解决方案告诉你真相找到一个独立的法语拼写检查库?如果它只是一种语言,我会使用sed和一个预定义的替换列表。我想做的是找到一个脚本或实用程序,它可以转换所有可能的unicode转换,或者至少转换出现在以下位置的unicode转换:好吧,我找到了一些东西。
python-c“print u'\u00e9lev\n'.encode('utf8')”
确实有效。但我如何将其应用于整个文件?哪些(脚本)语言可以访问或使用?Shell脚本,仅此而已。。我是个十足的新手。这就是为什么我想知道是否有现成的解决方案告诉你真相找到一个独立的法语拼写检查库?如果它只是一种语言,我会使用sed和一个预定义的替换列表。我想做的是找到一个脚本或实用程序,它可以转换所有可能的unicode转换,或者至少转换出现在以下位置的unicode转换:好吧,我找到了一些东西。
python-c“print u'\u00e9lev\n'.encode('utf8')”
确实有效。但是如何将其应用于整个文件?