Warning: file_get_contents(/data/phpspider/zhask/data//catemap/0/windows/17.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
PHP:转换问题"’&引用;从ISO-8859-1到UTF-8的字符_Php_Utf 8_Character Encoding_Iso 8859 1_Iconv - Fatal编程技术网

PHP:转换问题"’&引用;从ISO-8859-1到UTF-8的字符

PHP:转换问题"’&引用;从ISO-8859-1到UTF-8的字符,php,utf-8,character-encoding,iso-8859-1,iconv,Php,Utf 8,Character Encoding,Iso 8859 1,Iconv,我在使用PHP将ISO-8859-1数据库内容转换为UTF-8时遇到一些问题。我正在运行以下代码进行测试: // Connect to a latin1 charset database // and retrieve "Georgia O’Keeffe", which contains a "’" character $connection = mysql_connect('*****', '*****', '*****'); mysql_select_db('*****', $connec

我在使用PHP将ISO-8859-1数据库内容转换为UTF-8时遇到一些问题。我正在运行以下代码进行测试:

// Connect to a latin1 charset database 
// and retrieve "Georgia O’Keeffe", which contains a "’" character
$connection = mysql_connect('*****', '*****', '*****');
mysql_select_db('*****', $connection);
mysql_set_charset('latin1', $connection);
$result = mysql_query('SELECT notes FROM categories WHERE id = 16', $connection);
$latin1Str = mysql_result($result, 0);
$latin1Str = substr($latin1Str, strpos($latin1Str, 'Georgia'), 16);

// Try to convert it to UTF-8
$utf8Str = iconv('ISO-8859-1', 'UTF-8', $latin1Str);

// Output both
var_dump($latin1Str);
var_dump($utf8Str);
当我在Firefox的源代码视图中运行此程序时,确保Firefox的编码设置设置为“Western(ISO-8859-1)”,我得到以下结果:

到目前为止,一切顺利。第一个输出包含那个奇怪的引号,我可以正确地看到它,因为它在ISO-8859-1中,Firefox也是如此

在我将Firefox的编码设置更改为“UTF-8”后,看起来如下所示:


报价到哪里去了?
iconv()
不是应该将其转换为UTF-8吗?

U+2019右单引号不是ISO-8859-1中的字符。它是中的一个字符,如0x92。实际的ISO-8859-1字符0x92很少使用,称为“专用2”

贴错标签是很常见的 Windows-1252文本数据与 字符集标签ISO-8859-1。万维网 浏览器和电子邮件客户端处理 MIME字符集ISO-8859-1 as Windows-1252字符,以便 允许这样的错误标记,但事实并非如此 不应该有标准的行为和谨慎 应采取措施避免产生这些问题 ISO-8859-1中标记的字符 内容


看来这就是这里发生的事情。将“ISO-8859-1”更改为“windows-1252”。

这将解决您的问题,假设您的页眉
字符集
为utf-8:

// Opens a connection to a MySQL server
$connection = mysql_connect ($server, $username, $password);
$charset = mysql_client_encoding($connection);
$flagChange = mysql_set_charset('utf8', $connection);
echo "The character set is: $charset</br>mysql_set_charset result:$flagChange</br>";
//打开到MySQL服务器的连接
$connection=mysql\u connect($server、$username、$password);
$charset=mysql\u client\u编码($connection);
$flagChange=mysql\u set\u字符集('utf8',$connection);
echo“字符集是:$charset
mysql\u set\u charset result:$flagChange
”;
Wow,我做到了,我看到了UTF-8模式下的U+2019!但使用“windows-1252”将大量数据从“ISO-8859-1”转换为“UTF-8”安全吗?换句话说,所有ISO-8859-1字符是否仍能正确转换?字符0x80-0x9F将无法正确转换。但这些是几乎从未使用过的控制字符。@mattalexx如果您检查字符串中该范围内的字符并找到任何字符,那么很有可能该字符串是在Windows-1252中编码的。如果你找不到这个范围内的任何字符,它更有可能是ISO-8859-1。如果我能给你+10,我会的。几个星期来,我一直在用这个问题把我的头撞在砖墙上,你的回答解决了其他建议无法解决的问题