Warning: file_get_contents(/data/phpspider/zhask/data//catemap/1/php/260.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
PHP单词爬虫_Php_Curl - Fatal编程技术网

PHP单词爬虫

PHP单词爬虫,php,curl,Php,Curl,如何从一个数组中的网页中获取所有唯一的单词?(没有所有属性和javascript等) 有人能帮我吗?试试这个获取文本 这一个将帮助您:看看 然后做一些类似的事情: <?php include_once('simplehtmldom/simple_html_dom.php'); $string = file_get_html('http://www.google.com')->plaintext; $words = preg_split('/[\s,.]+/', $string,

如何从一个数组中的网页中获取所有唯一的单词?(没有所有属性和javascript等)

有人能帮我吗?

试试这个获取文本 这一个将帮助您:

看看

然后做一些类似的事情:

<?php

include_once('simplehtmldom/simple_html_dom.php');

$string = file_get_html('http://www.google.com')->plaintext;
$words = preg_split('/[\s,.]+/', $string, null, PREG_SPLIT_NO_EMPTY);

var_dump(array_unique($words));

?>

uhm,dom->dom文档->所有文本内容/nodeValue内容->通过空格分解为数组->然后查看..玩得开心