使用curl命令提取价格
我尝试使用curl命令提取一些信息 通过一个简单的grep,我提取了标题:使用curl命令提取价格,curl,Curl,我尝试使用curl命令提取一些信息 通过一个简单的grep,我提取了标题: grep-o”[^php cli的DOMDocument+DOMXPath可以轻松提取价格 curl -ks https://bulevip.com/es/pre-entreno/20927-cellucor-c4-original-pre-workout-390-gr-60-servicios.html | php -r 'echo (new DOMXPath(@DOMDocument::loadHTML(stream
grep-o”[^php cli的DOMDocument+DOMXPath可以轻松提取价格
curl -ks https://bulevip.com/es/pre-entreno/20927-cellucor-c4-original-pre-workout-390-gr-60-servicios.html | php -r 'echo (new DOMXPath(@DOMDocument::loadHTML(stream_get_contents(STDIN))))->query("//span[contains(@class,\"product-price-js\")]")->item(0)->getAttribute("content");'
顺便说一句
例如,您说您已经使用了标题提取
grep -o "<title>[^<]*" | sed -e 's/<[^>]*>//g'
将正确翻译任何html编码字符:)
如果我们对它进行测试:
$ echo '<title>blåbærsyltetøy</title>' > html
$ cat html | grep -o "<title>[^<]*" | sed -e 's/<[^>]*>//g'
blåbærsyltetøy
$ cat html | php -r 'echo (@DOMDocument::loadHTML(stream_get_contents(STDIN)))->getElementsByTagName("title")->item(0)->textContent;'
blåbærsyltetøy
$
您的标题提取器在任何HTML编码字符上都会失败。例如,如果标题是blå;bæ;rsyltetø;y
,则正确的翻译是blåbærsyltetøy
(挪威语代表蓝莓酱
),但您的提取器将以完全不可读的blå;bæ;rsyltetø;y
结尾。如果标题包含特殊字符,例如&
或
或^
,则提取器也将失败。要获得正确的翻译,您可以改为:php-r'echo(@DOMDocument::loadHTML(stream_get_contents(STDIN))->getElementsByTagName(“title”)->item(0)->textContent;'
$ echo '<title>blåbærsyltetøy</title>' > html
$ cat html | grep -o "<title>[^<]*" | sed -e 's/<[^>]*>//g'
blåbærsyltetøy
$ cat html | php -r 'echo (@DOMDocument::loadHTML(stream_get_contents(STDIN)))->getElementsByTagName("title")->item(0)->textContent;'
blåbærsyltetøy
$
$ echo '<title>AT&T</title>' > html
$ cat html | grep -o "<title>[^<]*" | sed -e 's/<[^>]*>//g'
AT&T
$ cat html | php -r 'echo (@DOMDocument::loadHTML(stream_get_contents(STDIN)))->getElementsByTagName("title")->item(0)->textContent;'
AT&T