PHP获取纯文本_Php_Curl_Plaintext

PHP获取纯文本

php curl

PHP获取纯文本,php,curl,plaintext,Php,Curl,Plaintext,我在PHP中使用cURL来获取网页内容，它工作得很好。但是我的程序现在只需要从目标站点获取纯文本，而不是HTML。我已经广泛地寻找了这个问题，但似乎没有人找到答案。我还尝试在cURL选项中设置CURLOPT_TRANSFERTEXT=1，但这似乎对结果没有影响知道为什么会发生这种情况吗？确保您具备以下条件： curl_setopt($curl, CURLOPT_RETURNTRANSFER, true); 然后，curl\u exec的返回值应该是数据。我想这就是您要查找的： <? $

我在PHP中使用cURL来获取网页内容，它工作得很好。但是我的程序现在只需要从目标站点获取纯文本，而不是HTML。我已经广泛地寻找了这个问题，但似乎没有人找到答案。我还尝试在cURL选项中设置

CURLOPT_TRANSFERTEXT=1

，但这似乎对结果没有影响

知道为什么会发生这种情况吗？

确保您具备以下条件：

curl_setopt($curl, CURLOPT_RETURNTRANSFER, true);

然后，

curl\u exec

的返回值应该是数据。

我想这就是您要查找的：

<?
$address = file_get_contents('http://www.thesite.com/file.html');
echo $address;



$file = file_get_contents('./file.txt', true);

 or 

$file = file_get_contents('./file.txt', FILE_USE_INCLUDE_PATH);

?>

实际上，我这样做是为了获得另一页的内容

<?php
function curl_get_file_contents($URL)
    {
        $c = curl_init();
        curl_setopt($c, CURLOPT_RETURNTRANSFER, 1);
        curl_setopt($c, CURLOPT_URL, $URL);
        $contents = curl_exec($c);
        curl_close($c);

        if ($contents) return $contents;
            else return FALSE;
    }


echo curl_get_file_contents("http://www.php.net");
?>

但是它会将全部内容返回给我。

你的意思是要去掉页面上的所有HTML标记吗

只需使用。

这是我目前获取数据的方法。不过我只想要纯文本。不是像这样的HTMLprovides@Alan：如果您不希望在打印到页面时呈现HTML标记，请使用。如果您不想使用HTML标记，那么使用.not plain，而是整个页面-->$address=file_get_contents（'）；我认为仅仅以文本格式分离整个文件是不可能的，因为它不会返回任何格式化的内容，并且会把一切都搞糟。。。如果要返回文本文件，最好读取xml文件甚至文本文件。