Php 获取UNICODE字符而不是十六进制字符
我正在为IMDB使用scraper,问题是一些字符是UNICODEPhp 获取UNICODE字符而不是十六进制字符,php,unicode,encoding,utf-8,php-curl,Php,Unicode,Encoding,Utf 8,Php Curl,我正在为IMDB使用scraper,问题是一些字符是UNICODE和#xEF。 我将这个刮刀与CURL一起使用,答案是UTF8编码的字符串 我尝试使用mb\u detect\u encoding()获取字符串的编码,并使用UTF-8进行应答 $html = $this->geturl("${imdbUrl}combined"); mb_detect_encoding($html); 我有一个字符串,里面有一些十六进制值,比如: $var = 'Saï
和#xEF代码>。
我将这个刮刀与CURL一起使用,答案是UTF8编码的字符串
我尝试使用mb\u detect\u encoding()获取字符串的编码,并使用UTF-8进行应答
$html = $this->geturl("${imdbUrl}combined");
mb_detect_encoding($html);
我有一个字符串,里面有一些十六进制值,比如:
$var = 'Saïd Taghmaoui'
因此,我尝试使用utf8\u decode()获取$html的值,但是运气不好,我仍然有一些十六进制字符
所以我有几个问题:
1-这方面的最佳解决方案是什么?我想象不同的场景,例如读取字符串并使用正则表达式更改所有带有字符的十六进制代码,但我不确定这是否是最佳解决方案,而且我不知道如何为此创建正则表达式
2-溶液可以通过卷曲吗?我的意思是管理一些配置来设置UTF-8中cURL的编码,例如
我尝试使用函数recode_string或iconv或mb_convert_编码基本上,我的问题是刮板的答案带有UTF-8编码,但在打印文本之前,我需要使用此函数处理数据
$var = 'Saïd Taghmaoui'
htmlspecialchars(html_entity_decode($var, ENT_QUOTES, 'UTF-8'), ENT_NOQUOTES, 'UTF-8');