java编译中的正则表达式
首先,我知道用正则表达式解析HTML是不好的。 但是,幸运的是,我提取代码的网站很简单,所以我使用这种方法总会得到很好的结果java编译中的正则表达式,java,html,regex,swing,label,Java,Html,Regex,Swing,Label,首先,我知道用正则表达式解析HTML是不好的。 但是,幸运的是,我提取代码的网站很简单,所以我使用这种方法总会得到很好的结果 Pattern p = Pattern.compile("(?<=<span class=\\\"itemName\\\">).*(?=</span>)"); Matcher m = p.matcher(code); 但是,相反,它返回: PESCA INSOLITA</span></a><li><
Pattern p = Pattern.compile("(?<=<span class=\\\"itemName\\\">).*(?=</span>)");
Matcher m = p.matcher(code);
但是,相反,它返回:
PESCA INSOLITA</span></a><li><a href="/uy/synop...
PESCA Isolata你在用贪婪的匹配器来匹配你的*
。这会导致匹配器一直匹配到HTML文档中的最后一个span
标记。相反,使用*?
——或者更好的是,使用解析器…您正在使用贪婪的匹配器来匹配您的*
。这会导致匹配器一直匹配到HTML文档中的最后一个span
标记。相反,使用*?
——或者更好的是,使用解析器…我想获取的字符数是不规则的。@SebaPaz我不明白为什么这会相关。我想获取的字符数是不规则的。@SebaPaz我不明白为什么这会相关。“我做错了什么?”-你已经回答了-“我知道用正则表达式解析HTML是不好的”…:-)“我做错了什么?”-你已经回答了“我知道用正则表达式解析HTML是不好的”…:-)
PESCA INSOLITA</span></a><li><a href="/uy/synop...