Http 为什么使用Jsoup.connect(";someurl";).get()的结果与;“查看页面代码”;或;“检查元件”;含铬

Http 为什么使用Jsoup.connect(";someurl";).get()的结果与;“查看页面代码”;或;“检查元件”;含铬,http,jsoup,Http,Jsoup,如果我打印从Jsoup.connect(“someurl”).get()获取的文档,它将具有如下形式的操作 /login.do;sessionid=74667165451B52E3B25B8C48A1B1655711?action=doLogin. 但是如果选中“查看页面代码”或“检查元素”,则它只有以下内容,没有sessionid <form name="loginForm" method="post" action="/login.do?action=doLogin"> 为

如果我打印从Jsoup.connect(“someurl”).get()获取的文档,它将具有如下形式的操作

/login.do;sessionid=74667165451B52E3B25B8C48A1B1655711?action=doLogin.

但是如果选中“查看页面代码”或“检查元素”,则它只有以下内容,没有sessionid

<form name="loginForm" method="post" action="/login.do?action=doLogin">

为什么会有不同,浏览器不是一个页面就是一个获取方法吗

有两个(可能)原因:

  • 本网站可使用(java-脚本或类似工具;Jsoup不支持这些,因此不执行任何操作
  • 该网站有不同的视图,如手机、浏览器等(根据用户代理的不同,你会得到一个页面)
  • 要查看此处适用的内容,您可以打印文档并在预期位置查找用户代理测试(如源代码开头的脚本)或javascripts。您还可以设置另一个用户代理(如firefox)并再次测试


    但正如luksch在评论中所说:如果没有更多信息,很难回答这个问题。

    如果没有具体的网址和对网络上发生的事情的分析,很难回答您的问题,很可能是Jsoup无法执行的JavaScript动态页面内容。