Java 从html文件中提取链接时,将相对URL转换为绝对URL
在获取一个网页后,我想以绝对形式提取该html页面的所有大纲链接。Html页面通常具有以下形式的相对URL(我由Apache Tika提取):Java 从html文件中提取链接时,将相对URL转换为绝对URL,java,url,apache-tika,Java,Url,Apache Tika,在获取一个网页后,我想以绝对形式提取该html页面的所有大纲链接。Html页面通常具有以下形式的相对URL(我由Apache Tika提取): link.html ./link.html somehost/link.html /path/link.html ./path/link.html 我想将所有这些转换为绝对URL。 是否有一致的Java库来执行此操作,这样我就不必使用if-else来执行这些操作?因为可能还有很多我不知道的其他表单,我需要一些能够
link.html
./link.html
somehost/link.html
/path/link.html
./path/link.html
我想将所有这些转换为绝对URL。
是否有一致的Java库来执行此操作,这样我就不必使用if-else来执行这些操作?因为可能还有很多我不知道的其他表单,我需要一些能够处理任何类型的大纲链接的东西,特别是这里提到的那些。Check class.@luigimendoza我需要一个像public URL getAbsolute(URL parent,String relativeURL)这样的方法。使用URI类,我需要知道协议、路径、方案、主机等,并且需要知道在相对URL上使用if-else的所有内容。但我应该去检查URI类提供的所有功能。谢谢。好吧,你需要它们来创建一个绝对的URL。。。