解码php字符串中的日语字符?

解码php字符串中的日语字符?,php,html,curl,Php,Html,Curl,我正在使用PHP中的cURL来废弃一个网页。我需要得到的一些单词是日语字符。我还使用简单的DOM解析器来帮助我轻松解析源代码。我在弄清楚如何正确地获取日语字符方面有点困难。每次在页面上运行以下脚本时,我都会发现没有收到任何数据。我想我需要以某种方式将字符转换为UTF-8标准,但我不完全确定如何做到这一点。虽然它很好地抓住了所有的英文字符,所以我知道这个脚本确实有效。它对其他角色不起作用。有人认为他们能帮我吗?我还提供了一个我正在废弃的源代码的示例 代码: $base='{website url}

我正在使用PHP中的cURL来废弃一个网页。我需要得到的一些单词是日语字符。我还使用简单的DOM解析器来帮助我轻松解析源代码。我在弄清楚如何正确地获取日语字符方面有点困难。每次在页面上运行以下脚本时,我都会发现没有收到任何数据。我想我需要以某种方式将字符转换为UTF-8标准,但我不完全确定如何做到这一点。虽然它很好地抓住了所有的英文字符,所以我知道这个脚本确实有效。它对其他角色不起作用。有人认为他们能帮我吗?我还提供了一个我正在废弃的源代码的示例

代码:

$base='{website url}';
$curl=curl_init();
curl_setopt($curl,CURLOPT_SSL_VERIFYPEER,FALSE);
curl_setopt($curl,CURLOPT_头,数组('User-Agent:Mozilla/5.0(X11;Ubuntu;Linux i686;rv:19.0)Gecko/20100101 Firefox/19.0');
curl_setopt($curl,CURLOPT_FOLLOWLOCATION,true);
curl_setopt($curl,CURLOPT_URL,$base);
curl_setopt($curl,CURLOPT_REFERER,$base);
curl_setopt($curl,CURLOPT_RETURNTRANSFER,TRUE);
$str=curl\u exec($curl);
curl_close($curl);
//创建DOM对象
$html=新的简单html\U dom();
//从字符串加载HTML
$html->load($str);
foreach($html->find('div.holder')作为$element){
如果($element->find('div.img-small',0)){
$title='';
$image='';
foreach($element->find('a[href]')作为$tempElement){
如果($tempElement->find('img')){
$image=$tempElement->find('img')->src;
}否则{
$title=$tempElement->innertext;
}
}
回显$title.“
”; } }
数据:


把这个放在页面顶部

<head>
<META http-equiv="Content-Type" Content="text/html; charset=euc-jp">
</head>

我正在删除网站上的信息,因此无法修改页面的源代码。
<div class="holder">
    <div class="img-small">
        <a href="/link/abcd"><img src="/images/image.png"></a>
    </div>

    <div>
        <div>
            <img title="This is a title" class="valign" src="/images/image.png"><b>
                <a href="/link/1234abcd">{Japanese characters}</a>
        </div>          
    </div>
</div>
<head>
<META http-equiv="Content-Type" Content="text/html; charset=euc-jp">
</head>