Java 从以下代码中选择名称的正则表达式 alt=“Abdul Aziz”width=“75”height=“75”class=“thumb border”>

Java 从以下代码中选择名称的正则表达式 alt=“Abdul Aziz”width=“75”height=“75”class=“thumb border”>,java,regex,Java,Regex,我想从上面的html中选择“Abdul Aziz”。我该怎么做?它必须是通用的,因为我必须从外观相似的HTML中选择许多名称。不确定您使用的是什么语言,但这里有一个模式可以帮助您实现这一点。注意,用正则表达式解析HTML有各种各样的缺点 alt="Abdul Aziz" width="75" height="75" class="thumb-border"></td> 这将把alt=”“之间的内容检索到第一个捕获组中 "/alt=\"(.*?)\".*?>/" 将选择

我想从上面的html中选择“Abdul Aziz”。我该怎么做?它必须是通用的,因为我必须从外观相似的HTML中选择许多名称。

不确定您使用的是什么语言,但这里有一个模式可以帮助您实现这一点。注意,用正则表达式解析HTML有各种各样的缺点

alt="Abdul Aziz" width="75" height="75" class="thumb-border"></td>
这将把alt=”“之间的内容检索到第一个捕获组中

"/alt=\"(.*?)\".*?>/"

将选择整个语句,然后您可以删除代码中的alt和引号。

使用Javascript将更加一致:

alt="[\w\s]+"
然后遍历元素并读取alt属性

或者,如果使用jQuery,则可以使用选择器:


什么站台?什么语言?你是否意识到正则表达式往往是一个很好的例子?在HTML上使用正则表达式并不总是明智的。几乎所有平台都有很好的解析库,可以尝试一下。你能提到整个标签吗?如果您使用的是jQuery或YUI,则可以使用选择器。客户端Javascript特别适合获取现有元素的属性。如果你有jQuery,你可以用比vanilla.jsWell更短的语法轻松地完成它。事实上,这是我的主题Java开发的一项任务,教授强迫我用重复使用Java来完成这项任务。不确定“当心…”是否会减少它。这真的取决于解析的多少/什么。在某些场景中,非常有针对性、非常有限地使用正则表达式可能是最实际的。
//You can get elements by tag :
els = document.getElementsByTag('td');

// or you can get elements by class name :
els = document.getElementsByClassName('thumb-border');