使用正则表达式查找&书信电报;img…/>&引用;及&书信电报;脚本…></脚本>&引用;在HTML字符串中

使用正则表达式查找&书信电报;img…/>&引用;及&书信电报;脚本…></脚本>&引用;在HTML字符串中,html,regex,scala,Html,Regex,Scala,我第一次尝试使用正则表达式在Scala中搜索网页中的图像和脚本。我想出的表达方式是 图像: /(<img\S+\s+\/>)+/ /()+/ 脚本: /(<script\s+\S+><\/script>)+/ /()+/ 我对HTML代码或使用正则表达式一无所知,因此我不确定需要什么来指定它应该匹配,其中..可以是任意数量的字符或空格。这只是我用Scala编写的编程任务的一小部分,我们必须使用正则表达式。像]*>这样的正则表达式将匹配 像这样的正则表达

我第一次尝试使用正则表达式在Scala中搜索网页中的图像和脚本。我想出的表达方式是

图像:

/(<img\S+\s+\/>)+/
/()+/
脚本:

/(<script\s+\S+><\/script>)+/
/()+/
我对HTML代码或使用正则表达式一无所知,因此我不确定需要什么来指定它应该匹配
,其中
..
可以是任意数量的字符或空格。这只是我用Scala编写的编程任务的一小部分,我们必须使用正则表达式。

]*>
这样的正则表达式将匹配


这样的正则表达式有什么问题?您是否发现这些正则表达式不起作用的情况?(我能想到一些。)另外,必读:
<script>
  <!-- This "</script>" doesn't end the script, but fools the RegEx -->
</script>