Java 从主机获取主页
我有一个主机列表,想得到他们的主页URL。标头html中存在的变量位置有时返回URL,并且在大多数情况下未设置参数。例如,URL“”没有位置参数,主页为“”。如何从主机URL获取主页URL?Java 从主机获取主页,java,url,httpresponse,hostname,Java,Url,Httpresponse,Hostname,我有一个主机列表,想得到他们的主页URL。标头html中存在的变量位置有时返回URL,并且在大多数情况下未设置参数。例如,URL“”没有位置参数,主页为“”。如何从主机URL获取主页URL? 谢谢你你的案子似乎是一场寻宝游戏。遵循以下线索: http://www.sharif.ir返回HTTP 200,页面包含自动html重定向(meta-HTTP equiv=refresh)到页面/c(http://www.sharif.ir/c) http://www.sharif.ir/c返回HTTP
谢谢你你的案子似乎是一场寻宝游戏。遵循以下线索:
返回HTTP 200,页面包含自动html重定向(meta-HTTP equiv=refresh)到页面http://www.sharif.ir
(/c
)http://www.sharif.ir/c
返回HTTP 302,它重定向到http://www.sharif.ir/c
http://www.sharif.ir/c/portal/layout
返回HTTP 302,它重定向到http://www.sharif.ir/c/portal/layout
http://www.sharif.ir/home
首先,您需要在第一个页面的结果头中解析meta-refresh标记以获取位置(内容属性:
url=
)。您问的不太清楚,但是如果您请求域的根目录,域应该发送回其“主页”的内容(http://www.example.com
,例如)或者它应该返回HTTP 301或302响应,告诉您“主页”是什么。您可以使用“”地址来测试我的示例。我的问题不是重定向。我只需要“主页”的地址,而不是内容。在我的示例中,主机返回内容,但URL是更改的。如何获取该URL。要获取地址,您必须发出请求,因为请求可能是重定向。如果返回200响应,则不必读取完整响应;这意味着它直接响应您请求的URL。如果返回301或302,然后从中读取重定向信息,并使用更新的URL重试。我得到200,但URL已更改。我需要新的URL。