Php 存储数据的奇怪字符编码，旧脚本正在向它们显示精细的新脚本没有_Php_Mysql_Database_Codeigniter_Character Encoding

Php 存储数据的奇怪字符编码，旧脚本正在向它们显示精细的新脚本没有

php mysql database codeigniter character-encoding

Php 存储数据的奇怪字符编码，旧脚本正在向它们显示精细的新脚本没有,php,mysql,database,codeigniter,character-encoding,Php,Mysql,Database,Codeigniter,Character Encoding,我正试图重写一个旧网站。它是波斯语，使用人字/阿拉伯字符创建数据库`db`默认字符集utf8 COLLATE utf8\u波斯语\u ci；使用'db'；几乎所有我的表格/列COLLATE都设置为utf8\u波斯语\u ci 我正在为我的新脚本使用codeigniter，我有 'char_set' => 'utf8', 'dbcollat' => 'utf8_persian_ci', 在数据库设置中，所以没有问题这就是奇怪的部分旧脚本正在使用某种数据库引擎，称为TUBA

我正试图重写一个旧网站。它是波斯语，使用人字/阿拉伯字符

创建数据库`db`默认字符集utf8 COLLATE utf8\u波斯语\u ci；使用'db'；几乎所有我的表格/列COLLATE都设置为utf8\u波斯语\u ci

我正在为我的新脚本使用codeigniter，我有

'char_set' => 'utf8',
'dbcollat' => 'utf8_persian_ci',

在数据库设置中，所以没有问题

这就是奇怪的部分

旧脚本正在使用某种数据库引擎，称为TUBADBENGINE或TubaDB引擎。。。没什么特别的

当我使用旧脚本以波斯语在数据库中输入一些数据时，当我查看数据库时，字符会像ØüÙ…Ø±Ø§Ù†一样存储

旧脚本fetch/显示数据很好，但新脚本使用与数据库相同的奇怪字体/字符集显示数据

所以当我输入اااا时，数据库存储的数据看起来像ࡷࡷ…ࡷࡷࡷࡷࡷࡷࡷࡷࡷࡷࡷࡷࡷࡷࡷ，当我在新脚本中获取它时，我看到ࡷࡷࡷࡷ…ࡷ

如果不存在“tnewsgroups”，则创建表 `ID`int11非空自动增量， `fName`varchar200 COLLATE utf8\u波斯语\u ci默认为空，主键'ID` ENGINE=InnoDB DEFAULT CHARSET=utf8 COLLATE=utf8\u PERSIS\u ci AUTO\u INCREMENT=11； - -正在转储表`tnewsgroups'的数据` - 在'tnewsgroups``ID`、`fName`值中插入 1, 'Ø¹Ù…Ø±Ø§Ù†', 2, 'Ù…Ø¹Ù…Ø§Ø±ÛŒ', 3, 'Ø¨Ø±Ù‚', 4, 'Ù…Ú©Ø§Ù†ÛŒÚ©', 五,"测试",， 6，‘测试2’；另一方面，当我直接在数据库中输入

当然，我在数据库中存储了相同的内容

新剧本表现得很好

但是在旧剧本里我得到了

有人能理解这一点吗

这是大号发动机

旧脚本中的用法示例：

define("database_type" , "MYSQL");
define("database_ip" , "localhost");
define("database_un" , "root");
define("database_pw" , "");
define("database_name" , "nezam2");
define("database_connectionstring" , "");
$db = new TUBADBENGINE(database_type , database_ip , database_un , database_pw , database_name , database_connectionstring);
$db->Select("SELECT * FROM tnews limit 3");
if ($db->Lasterror() != "") { echo "<B><Font color=red>ÎØÇ ! áØÝÇ ãÌÏøÏÇ ÊáÇÔ ˜äíÏ";  exit(); }
for ($i = 0 ; $i < $db->Count() ; $i++) {
    $row = $db->Next();
    var_dump($row);
}

简言之，因为这已经被讨论过一千次了：

PHP持有一个字符串，比如漢字, 以UTF-8编码。用于此的字节是E6 BC A2 E5 AD 97。它通过设置为latin1的数据库连接发送此字符串。数据库接收字节E6 BC A2 E5 AD 97，认为这些字节代表拉丁字符。该数据库存储了字符æ¼、å-E6 BC A2 E5 AD 97在拉丁语1中映射到的字符。相同的过程使PHP接收相同的字节，然后将其视为UTF-8。对于PHP来说，即使数据库没有按应有的方式处理字符，往返也可以正常工作。因此，这里的问题是，当数据输入数据库时，数据库连接设置不正确。您必须将数据库中的数据转换为正确的字符。试试这个：

SELECT CONVERT(BINARY CONVERT(field_name USING latin1) USING utf8) FROM table_name

也许utf8不是你需要的，实验。如果可以，请将其更改为UPDATE语句以永久更新数据。

非常好，但我可以添加一些信息，以帮助处理大量记录，而无需手动测试它们

如果使用utf8的拉丁文1转换二进制CONVERTBINARY CONVERTfield_名称失败，它将打印NULL而不是field_名称内容

所以我用这个来找到那些记录：

SELECT IFNULL(
    CONVERT(BINARY CONVERT(field_name USING latin1) USING utf8)
    , '**************************************************')
FROM table_name

或者这个：

SELECT id, field_name, CONVERT(BINARY CONVERT(field_name USING latin1) USING utf8)
FROM table_name
WHERE CONVERT(BINARY CONVERT(field_name USING latin1) USING utf8) IS NULL

以及使用子句进行的更新，以仅影响转换成功的记录：

UPDATE table_name
SET
field_name = CONVERT(BINARY CONVERT(field_name USING latin1) USING utf8mb4 )
WHERE
CONVERT(BINARY CONVERT(field_name USING latin1) USING utf8mb4) IS NOT NULL

谢谢你的剧本@Deceze：有没有简单的方法可以对数据库中的每个字段执行这种转换？@Abdel5转储数据库并使用正确/错误的导入/导出字符集组合重新导入它可能是最简单的方法。