bash修复带噪数据法语字符

bash修复带噪数据法语字符,bash,csv,awk,utf,Bash,Csv,Awk,Utf,我的csv中有以下示例数据: VallÌÎÌãÌ´å©e,100 JoffÌÎÌãÌ´å©,240 我认为这是因为csv不支持utf-8。我将如何使用bash修复该问题?我想这是个法国名字 到目前为止,我尝试过使用SED bash将所有法语字符更改为使用SED的字母表: sed -i 'y/āáǎàēéěèīíǐìōóǒòūúǔùǖǘǚǜĀÁǍÀĒÉĚÈĪÍǏÌŌÓǑÒŪÚǓÙǕǗǙǛ/aaaaeeeeiiiioooouuuuüüüüAAAAEEEEIIIIOOOOUUUUÜÜÜÜ/' da

我的csv中有以下示例数据:

VallÌÎÌãÌ´å©e,100

JoffÌÎÌãÌ´å©,240
我认为这是因为csv不支持utf-8。我将如何使用bash修复该问题?我想这是个法国名字

到目前为止,我尝试过使用SED bash将所有法语字符更改为使用SED的字母表:

sed -i 'y/āáǎàēéěèīíǐìōóǒòūúǔùǖǘǚǜĀÁǍÀĒÉĚÈĪÍǏÌŌÓǑÒŪÚǓÙǕǗǙǛ/aaaaeeeeiiiioooouuuuüüüüAAAAEEEEIIIIOOOOUUUUÜÜÜÜ/' data.csv

但它不起作用,所以我不太确定如何修复它。

请尝试以下内容,并让我知道这是否有帮助

iconv -f utf8 -t ascii//TRANSLIT Input_file
以下是iconv的手册页所述内容:

描述 iconv程序以一种编码读取文本,并以另一种编码输出文本。如果没有提供输入文件,或者 是作为 破折号(-),iconv从标准输入读取。如果没有给出输出文件,iconv将写入标准输出。 如果未指定from编码,则默认值是从当前语言环境的字符编码派生的。如果未给出编码,则 默认为 从当前区域设置的字符编码派生


不幸的是,它没有修复为“VallIIIaI'a(C)e”@user3646742,您想将它们更改为英文字符,对吗?文件中的实际字节是多少?这看起来也不像UTF-8。请看如何提出一个明确的问题,甚至可能自己解决问题。