从宽度或高度高于指定值的HTML中提取所有图像-Regex
我正在尝试使用经典的ASP(如LinkedIn或Facebook)来实现一个小的链接共享功能 我需要做的是获取远程URL的HTML,并提取所有宽度大于50px的图像 我可以抓取HTML,也可以使用此正则表达式查找图像:从宽度或高度高于指定值的HTML中提取所有图像-Regex,regex,asp-classic,html-content-extraction,Regex,Asp Classic,Html Content Extraction,我正在尝试使用经典的ASP(如LinkedIn或Facebook)来实现一个小的链接共享功能 我需要做的是获取远程URL的HTML,并提取所有宽度大于50px的图像 我可以抓取HTML,也可以使用此正则表达式查找图像: 然后我可以提取路径,但有时它会匹配不是真实图像的 不管怎么说,我觉得你会因为经典的ASP而生气,但我的公司 我知道有很多关于这个问题的话题,大多数情况下,他们建议不要使用正则表达式,但我找不到一种方法来使用经典的asp。这里面有什么东西吗 关于这会让你接近: <img [
然后我可以提取路径,但有时它会匹配不是真实图像的
不管怎么说,我觉得你会因为经典的ASP而生气,但我的公司
我知道有很多关于这个问题的话题,大多数情况下,他们建议不要使用正则表达式,但我找不到一种方法来使用经典的asp。这里面有什么东西吗
关于这会让你接近:
<img [^>]*width="(0?[1-9]\d{2,}|[5-9]\d)"[^>]*>
]*width=“(0?[1-9]\d{2,}|[5-9]\d)”[^>]*>
它接受宽度为50或更大的图像标记
编辑:未指定宽度的标记:
<img [^>]*width="(0?[1-9]\d{2,}|[5-9]\d)"[^>]*>|<img ((?!width=)[^>])*>
]*width=“(0?[1-9]\d{2,}|[5-9]\d)”[^>]*>|])*>
无法将数字与(sane)正则表达式进行比较。如果图像标记未指定dimmensions,会发生什么情况?@SLaks♦: 好的,那么我想我必须检查正则表达式与Microsoft.XMLHTTP匹配的每个图像。Javascript将是实现这一点的方法。你能用它吗?疯狂的问题会产生更疯狂的解决方案。。。。不过,我同意@SLaks。如果您还有其他选择,请接受。谢谢@agent-j,但正如@Francisc所述,如果图像标记未指定尺寸,正则表达式将失败。如果高度先于宽度,该怎么办?正则表达式使用经典ASP解析HTML的另一个死胡同:)在图像标记结束(或类似于alt=“Hello>world”的内容之前,[^>]*
匹配
。因此,高度属性在哪里并不重要。