Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/java/378.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Java 如何使用正则表达式剪切URL_Java_Html_Split - Fatal编程技术网

Java 如何使用正则表达式剪切URL

Java 如何使用正则表达式剪切URL,java,html,split,Java,Html,Split,我正在尝试切碎一个包含java中若干信息的字符串。。 文本是这样的: <a href="http://www.hootsuite.com" rel="nofollow">HootSuite</a> 我正在考虑使用需要正则表达式的.split方法。。 我希望它将此字符串拆分为不带引号的URL。。http://...... .通用域名格式 然后是标签之间的文本。。这个案子很棘手 我会感谢你的帮助 谢谢您不想这样做。您希望使用XML或HTML解析套件,如。为什么,你问?因

我正在尝试切碎一个包含java中若干信息的字符串。。 文本是这样的:

<a href="http://www.hootsuite.com" rel="nofollow">HootSuite</a>

我正在考虑使用需要正则表达式的.split方法。。 我希望它将此字符串拆分为不带引号的URL。。http://...... .通用域名格式 然后是标签之间的文本。。这个案子很棘手

我会感谢你的帮助
谢谢

您不想这样做。您希望使用XML或HTML解析套件,如。为什么,你问?因为。

你不想这样做。您希望使用XML或HTML解析套件,如。为什么,你问?因为。

为什么不使用HTML解析器来提取
href
属性?更简单、更不脆弱。为什么不使用HTML解析器来提取
href
属性?更简单,更不脆弱。+1,我会说,尽管每次我看到这个回复,我知道作者没有写蜘蛛,因为互联网上有太多严重破坏的HTML,即使是最松散的解析器也无法通过。可能使这项任务更容易的是,我总是用相同的结构解析HTML。。。这是一个由Twitter API发回的URL。。结构总是一样的。。但我认为解析器将是最好的选择,这句臭名昭著的谩骂拯救了另一个灵魂。@AhmadAssaf让我充满了温暖的幸福之光。+1,我要说的是,每次我看到这个回复,我都知道作者没有写蜘蛛,因为互联网上有太多严重破坏的HTML,即使是最松散的解析器也无法通过。可能使这项任务更容易的是,我总是用相同的结构解析HTML。。。这是一个由Twitter API发回的URL。。结构总是一样的。。但我认为解析器将是最好的选择,而这句臭名昭著的谩骂拯救了另一个灵魂。@AhmadAssaf让我充满了温暖的幸福之光。