Warning: file_get_contents(/data/phpspider/zhask/data//catemap/8/file/3.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
File 是否有任何100%可靠且有效的方法来查找文本或csv文件编码_File_Csv_Encoding_Utf 8 - Fatal编程技术网

File 是否有任何100%可靠且有效的方法来查找文本或csv文件编码

File 是否有任何100%可靠且有效的方法来查找文本或csv文件编码,file,csv,encoding,utf-8,File,Csv,Encoding,Utf 8,是否有任何100%可靠且有效的方法来查找文件的编码。我尝试过BOM,但有时会失败,有没有其他完美的方法,或者完全不可能。没有。实际上,任何字节的随机累积在大多数单字节编码中都是有效的,如ISO-8859等。它可能会产生无意义的字符,但它是有效的。尝试不同的单字节编码将产生不同的无意义,但就编码而言,这一切都是有效的。然后你进入自然语言处理领域,去弄清楚某一系列的废话是否比另一个更感性,然后你开始用置信度指数给你的猜测打分。从定义上讲,这不是100%可靠的方法,而是猜测 唯一可以确定的是,排除某些

是否有任何100%可靠且有效的方法来查找文件的编码。我尝试过BOM,但有时会失败,有没有其他完美的方法,或者完全不可能。

没有。实际上,任何字节的随机累积在大多数单字节编码中都是有效的,如ISO-8859等。它可能会产生无意义的字符,但它是有效的。尝试不同的单字节编码将产生不同的无意义,但就编码而言,这一切都是有效的。然后你进入自然语言处理领域,去弄清楚某一系列的废话是否比另一个更感性,然后你开始用置信度指数给你的猜测打分。从定义上讲,这不是100%可靠的方法,而是猜测

唯一可以确定的是,排除某些具有更严格规则的编码;e、 g.并非每个字节序列在UTF-8中都有效。如果您试图将其解码为UTF-8,而解码器却抱怨,则可以排除该编码。这只剩下数百名其他候选人