Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/regex/17.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
从宽度或高度高于指定值的HTML中提取所有图像-Regex_Regex_Asp Classic_Html Content Extraction - Fatal编程技术网

从宽度或高度高于指定值的HTML中提取所有图像-Regex

从宽度或高度高于指定值的HTML中提取所有图像-Regex,regex,asp-classic,html-content-extraction,Regex,Asp Classic,Html Content Extraction,我正在尝试使用经典的ASP(如LinkedIn或Facebook)来实现一个小的链接共享功能 我需要做的是获取远程URL的HTML,并提取所有宽度大于50px的图像 我可以抓取HTML,也可以使用此正则表达式查找图像: 然后我可以提取路径,但有时它会匹配不是真实图像的 不管怎么说,我觉得你会因为经典的ASP而生气,但我的公司 我知道有很多关于这个问题的话题,大多数情况下,他们建议不要使用正则表达式,但我找不到一种方法来使用经典的asp。这里面有什么东西吗 关于这会让你接近: <img [

我正在尝试使用经典的ASP(如LinkedIn或Facebook)来实现一个小的链接共享功能

我需要做的是获取远程URL的HTML,并提取所有宽度大于50px的图像

我可以抓取HTML,也可以使用此正则表达式查找图像:

然后我可以提取路径,但有时它会匹配不是真实图像的

不管怎么说,我觉得你会因为经典的ASP而生气,但我的公司

我知道有很多关于这个问题的话题,大多数情况下,他们建议不要使用正则表达式,但我找不到一种方法来使用经典的asp。这里面有什么东西吗


关于

这会让你接近:

<img [^>]*width="(0?[1-9]\d{2,}|[5-9]\d)"[^>]*>
]*width=“(0?[1-9]\d{2,}|[5-9]\d)”[^>]*>
它接受宽度为50或更大的图像标记

编辑:未指定宽度的标记:

<img [^>]*width="(0?[1-9]\d{2,}|[5-9]\d)"[^>]*>|<img ((?!width=)[^>])*>
]*width=“(0?[1-9]\d{2,}|[5-9]\d)”[^>]*>|])*>

无法将数字与(sane)正则表达式进行比较。如果图像标记未指定dimmensions,会发生什么情况?@SLaks♦: 好的,那么我想我必须检查正则表达式与Microsoft.XMLHTTP匹配的每个图像。Javascript将是实现这一点的方法。你能用它吗?疯狂的问题会产生更疯狂的解决方案。。。。不过,我同意@SLaks。如果您还有其他选择,请接受。谢谢@agent-j,但正如@Francisc所述,如果图像标记未指定尺寸,正则表达式将失败。如果高度先于宽度,该怎么办?正则表达式使用经典ASP解析HTML的另一个死胡同:)在图像标记结束(或类似于
alt=“Hello>world”的内容之前,
[^>]*
匹配
。因此,高度属性在哪里并不重要。