Warning: file_get_contents(/data/phpspider/zhask/data//catemap/0/backbone.js/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
php错误编码为utf8从pdf中提取的文本_Php_Parsing_Pdf_Text_Utf 8 - Fatal编程技术网

php错误编码为utf8从pdf中提取的文本

php错误编码为utf8从pdf中提取的文本,php,parsing,pdf,text,utf-8,Php,Parsing,Pdf,Text,Utf 8,我需要从pdf文件中提取php变量中的文本,为此我使用了pdf2text,但在尝试将字符串转换为utf-8目标时遇到了问题 另外,如果有人知道更好的方法来删除字符串的空格和换行符,我将不胜感激 这是我使用的代码: header('Content-type: text/html; charset=utf-8'); mb_internal_encoding('UTF-8'); mb_http_output('UTF-8'); include('pdftophp.php'); $doc = new

我需要从pdf文件中提取php变量中的文本,为此我使用了pdf2text,但在尝试将字符串转换为utf-8目标时遇到了问题

另外,如果有人知道更好的方法来删除字符串的空格和换行符,我将不胜感激

这是我使用的代码:

header('Content-type: text/html; charset=utf-8');
mb_internal_encoding('UTF-8');

mb_http_output('UTF-8');

include('pdftophp.php');
$doc = new PDF2Text();
$doc->setFilename('pdf/prueba.pdf'); 
$doc->decodePDF();
$texto = $doc->output();

$resultado = "";
for ($i=0; $i < strlen($texto) ; $i++) { 
    if (substr($texto,$i,1) != " " && substr($texto,$i,1) != "\n"){
        $resultado.= substr($texto,$i,1);
    }
}

echo $resultado;
header('Content-type:text/html;charset=utf-8');
mb_内部_编码(“UTF-8”);
mb_http_输出(“UTF-8”);
包括('pdftophp.php');
$doc=新的PDF2Text();
$doc->setFilename('pdf/prueba.pdf');
$doc->decodePDF();
$texto=$doc->output();
$resultado=“”;
对于($i=0;$i
请详细说明存在的问题。如果您提供的字符串有哪些情况下会出现问题,那么调试会更容易-请看一看。尝试在echo上使用
utf8\u encode($resultado)
utf8\u decode($resultado)
。我已经尝试过了,但是如果字符串有波浪号或特殊字符,则会被询问所取代