Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/java/326.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Java 如何从HTML中提取字体标记?_Java_Android_Html - Fatal编程技术网

Java 如何从HTML中提取字体标记?

Java 如何从HTML中提取字体标记?,java,android,html,Java,Android,Html,我正在尝试提取字体名称,例如: String htmlContent = "<font face=\"impact\">Hdjdjdisid <font style=\"background-color:#ff0000\"> shejej</font></font>"; 这是我在网上找到的,但是它返回了所有标签的内容,我只想要面名称 String pattern = "<FONT (.*?)>"; Pattern p = Patte

我正在尝试提取字体名称,例如:

String htmlContent = "<font face=\"impact\">Hdjdjdisid <font style=\"background-color:#ff0000\"> shejej</font></font>";
这是我在网上找到的,但是它返回了所有标签的内容,我只想要
名称

String pattern = "<FONT (.*?)>";

Pattern p = Pattern.compile(pattern, Pattern.CASE_INSENSITIVE);
Matcher m = p.matcher(htmlContent);

if (m.find()) {
    // prints: <FONT FACE="Verdana" SIZE="12"> My Name is xyz </FONT></P>
    System.out.println(m.group());

    // prints: FACE="Verdana" SIZE="12"
    System.out.println(m.group(1));
}
字符串模式=”;
Pattern p=Pattern.compile(Pattern,Pattern.CASE\u不区分大小写);
匹配器m=p.Matcher(htmlContent);
if(m.find()){
//打印:我的名字是xyz
System.out.println(m.group());
//打印:FACE=“Verdana”SIZE=“12”
系统输出println(m.group(1));
}

如何仅提取面部名称?

在这种简单的情况下,请按如下方式调整图案:

<font[^>]+face="([^"]+)"
]+face=“([^”]+)”
转义以与java一起使用:

String pattern = "<font[^>]+face=\"([^\"]+)\"";
String pattern=“]+face=\”([^\“]+)\”;

但是正如其他人指出的:不要用正则表达式解析html。

为什么不使用html解析器,比如jsoup?jsoup extract元素
String pattern = "<font[^>]+face=\"([^\"]+)\"";