Text 从文本文件中删除二进制符号

Text 从文本文件中删除二进制符号,text,awk,sed,Text,Awk,Sed,我正在使用dos2unix命令将文本文件转换为unix格式,但我收到了以下几个文件的消息: dos2unix: Binary symbol found at line 6115 dos2unix: Skipping binary file w1.txt 当我在notepad++中打开文本文件时,我看到以下内容: 如何从文本文件中删除这些二进制符号?有什么命令可以使用吗?这些是仅供私人使用的字符 如果您正在使用dos2unix删除回车符字符,可以尝试以下替代方法 sed -i -e 's/\r

我正在使用dos2unix命令将文本文件转换为unix格式,但我收到了以下几个文件的消息:

dos2unix: Binary symbol found at line 6115
dos2unix: Skipping binary file w1.txt
当我在notepad++中打开文本文件时,我看到以下内容:


如何从文本文件中删除这些二进制符号?有什么命令可以使用吗?

这些是仅供私人使用的字符

如果您正在使用dos2unix删除回车符字符,可以尝试以下替代方法

sed -i -e 's/\r//g' file

这些是仅供私人使用的字符

如果您正在使用dos2unix删除回车符字符,可以尝试以下替代方法

sed -i -e 's/\r//g' file

尝试
perl-p-e的//[^[:ascii:]///g'inputfile
,这将删除非ascii字符。不确定这是否适用于您的文件,但值得一试。也许这些只是多字节字符?你检查过文件的编码了吗?我认为删除这个二进制字符是不明智的;您需要做的可能是将这些字符转换为正确的编码。dos2unix有很多这样做的选项。尝试了解原始文件的编码,以及在notepad++中尝试迁移到的编码。这里有一些例子:
文件
作为编码报告了什么?您可以转储几行
hextump-C
输出吗?第6130-6136行很好,因为
PUI
看起来像æ(wrt 6131)和
SSA
像å。如果重命名为
Holbk
它将不是同一个城市。尝试
perl-p-e的/[^[:ascii:][/g'输入文件
,这将删除非ascii字符。不确定这是否适用于您的文件,但值得一试。也许这些只是多字节字符?你检查过文件的编码了吗?我认为删除这个二进制字符是不明智的;您需要做的可能是将这些字符转换为正确的编码。dos2unix有很多这样做的选项。尝试了解原始文件的编码,以及在notepad++中尝试迁移到的编码。这里有一些例子:
文件
作为编码报告了什么?您可以转储几行
hextump-C
输出吗?第6130-6136行会很好,因为
PUI
看起来像æ(wrt 6131)和
SSA
像å。如果您重命名为
Holbk
,它将不是同一个城市。