Java正则表达式复杂模式
我有这样一个字符串(由HTML源代码生成):Java正则表达式复杂模式,java,html,regex,Java,Html,Regex,我有这样一个字符串(由HTML源代码生成): 弗斯特 第二 上面的 降低 但在一行中,我把它分开,使它看起来更好。 我想要实现的是一个正则表达式,它将捕获此表的所有行,因此匹配项为: <td> <tr>First</tr> </td> 弗斯特 , 秒 , 上面的 降低 最简单的选择是: *-捕获所有内容 *?-从第一个捕捉到第一个 我想让它捕捉相应的标签。有人能帮忙吗?您可以使用html解析引擎并运行类似的操作来从表中提取行
弗斯特
第二
上面的
降低
但在一行中,我把它分开,使它看起来更好。
我想要实现的是一个正则表达式,它将捕获此表的所有行,因此匹配项为:
<td>
<tr>First</tr>
</td>
弗斯特
,
秒
,
上面的
降低
最简单的选择是:
-捕获所有内容*
-从第一个*?
捕捉到第一个
我想让它捕捉相应的标签。有人能帮忙吗?您可以使用html解析引擎并运行类似的操作来从表中提取行
String url = "a.html";
Document doc = Jsoup.connect(url).get();
Elements rows = doc.select("table tr");
使用HTML解析器解析HTML。今后,请在发布前仔细查看预览。使用类似的方法,否则您将获得相关信息:您不应该使用正则表达式解析HTML。这个答案提供了一个奇妙的解释,解释了为什么不应该这样做:@andrewhompson我认为应该这样做,如果它将
regex
和html
视为标记组合,那么应该将此链接放在用户面前;)
<td>Second</td>
<td>
<tr>
<td>Upper</td>
</tr>
<tr>
<td>Lower</td>
</tr>
</td>
String url = "a.html";
Document doc = Jsoup.connect(url).get();
Elements rows = doc.select("table tr");