用PHP从另一个站点的页面中提取内容的最小脚本

用PHP从另一个站点的页面中提取内容的最小脚本,php,web-scraping,Php,Web Scraping,非常简单的事情。我有时想访问城市词典,但它在我所在的位置被阻止。 给出一个类似于 <form method="get" action="<?PHP echo htmlspecialchars($_SERVER['PHP_SELF']); ?>"> <input type="text" name="what" value="" /> <input type="submit" /> </form> 也许你正在寻找类似的东西,而不是编写一些

非常简单的事情。我有时想访问城市词典,但它在我所在的位置被阻止。 给出一个类似于

<form method="get" action="<?PHP echo htmlspecialchars($_SERVER['PHP_SELF']); ?>">
<input type="text" name="what" value="" />
<input type="submit" />
</form>

也许你正在寻找类似的东西,而不是编写一些无论如何都会被你的网络阻止的东西。

非常简单,非常奇怪的
文件获取内容($\u POST['what'])

您需要使用PHP进行一些DOM解析。您可以在PHP5中使用本机DOM解析器(推荐,请参见此处),也可以使用类似于简单htmldom解析器的库(http://simplehtmldom.sourceforge.net/)


然后,您可以使用post数据选择URL。

Nope。那个网站也被封锁了。但我的个人网站不是blocked@Emmerman-我甚至不想尝试加载该url:)我不想看到反代理pageOff主题:您应该使用
echo htmlspecialchars($\u SERVER['PHP\u SELF'])
来防止脚本注入,因为PHP\u SELF部分由用户提供。@Arch我怀疑类似的情况。谢谢你的提醒,你也可以让它空着:-)因为你可以输入
/path/to/something/that/user/shouldnt/see
Ye,我想。但请记住,你的主机可能会禁止它工作。唯一剩下的事情是,不管设置了什么,所以当我加载页面时,我会看到我要搜索的网站主页
,如果(isSet($what))
没有用,你可以在前面设置:)
<form method="get" action="">
<input type="text" name="what" value="" />
<input type="submit" />
</form>

<?PHP
$what = isSet($_GET["what"])?htmlentities($_GET["what"]):"";
echo file_get_contents("http://www.urbandictionary.com/define.php?term=".urlencode($what));
?>