Php 使用get内容后如何过滤数据

Php 使用get内容后如何过滤数据,php,curl,file-get-contents,Php,Curl,File Get Contents,我想知道如何在远程网站上找到一个数字,并使其成为一个变量 例如,如果我想找到“AMZN”的股票报价,我会使用curl或获取页面上的内容“http://stock-quotes.com/AMZN“使其成为名为$contents的变量字符串 既然我有$contents,我将如何找到AMZN报价?我正在考虑使用正则表达式缩小行的范围,比如查找“AMZN=35点”,然后执行另一个函数删除字符串开头和结尾的“AMZN=”和“点”,这样就只剩下“35”了 人们就是这样做的吗?1.)DOM元素 2.)简单XM

我想知道如何在远程网站上找到一个数字,并使其成为一个变量

例如,如果我想找到“AMZN”的股票报价,我会使用curl或获取页面上的内容“http://stock-quotes.com/AMZN“使其成为名为$contents的变量字符串

既然我有$contents,我将如何找到AMZN报价?我正在考虑使用正则表达式缩小行的范围,比如查找“AMZN=35点”,然后执行另一个函数删除字符串开头和结尾的“AMZN=”和“点”,这样就只剩下“35”了

人们就是这样做的吗?

1.)DOM元素

2.)简单XML

3)预赛

4.)strpos

我一直在做的事情(比如spidering等)是使用PHP中的simple_html_dom库,然后检查站点的标记

如前所述,缺点是如果标记发生更改,则需要修改代码,但通常这相当容易,如果使用具有信息性标记(所需元素的一致类名等)的源代码,则更容易


库链接:

最好的方法是使用DOM,但是使用preg#u match('#AMZN=(*)points#',$contents,$match)进行匹配很容易,但是如果标记更改,匹配就会中断,需要查看实际页面,为什么不将其作为答案而不是评论发布?@AJ as使用reg expression match而不是DOM通常以downvotes结尾,因为它非常脆弱,所以会获得downvotes。也就是说,SimpleXMl等人也是如此;它们通常根本不处理格式错误的HTML。如果您首先通过HTMLPurifier运行它,然后尝试SimpleXML,您可能会有更好的运气。这些是我可以使用的步骤还是4种不同的方法?它们是你可以使用的4种不同的方法。它们是按优度列出的