Warning: file_get_contents(/data/phpspider/zhask/data//catemap/9/java/357.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Java 当我用jsoup解析时,标记的内容消失了_Java_Jsoup - Fatal编程技术网

Java 当我用jsoup解析时,标记的内容消失了

Java 当我用jsoup解析时,标记的内容消失了,java,jsoup,Java,Jsoup,我在学习jsoup图书馆。他面临着困难。Chrome开发者工具中的标记在解析时消失。帮帮我 缺少id为cbox_module的div标记的内容。告诉我如何获取此标签的内容 这是我的密码 public static void main(String[] args) throws Exception { // TODO Auto-generated method stub String url = "https://comic.naver.com/webtoon/det

我在学习jsoup图书馆。他面临着困难。Chrome开发者工具中的标记在解析时消失。帮帮我

缺少id为cbox_module的div标记的内容。告诉我如何获取此标签的内容

这是我的密码

public static void main(String[] args) throws Exception {
    // TODO Auto-generated method stub
    String url = "https://comic.naver.com/webtoon/detail.nhn?titleId=597447&no=364&weekday=sat";
    String address = "https://comic.naver.com/comment/comment.nhn?titleId=651673&no=514";
    
    Document doc = Jsoup.connect(address).get();
    Elements el = doc.select("#cbox_module");
    
    System.out.println(doc);
    System.out.println(el);
}

如果我的英语不好,我很抱歉。我是外国人,我使用的是翻译器。

不完全确定您要在这里提取什么,但您使用的是
cbox\u模块
,它是
标记之后的第一个元素

通过chrome tools中的“网络”选项卡,我可以看到以下请求:

https://apis.naver.com/commentBox/cbox/web_naver_list_jsonp.json?ticket=comic&templateId=webtoon&pool=cbox3&_callback=jQuery112408278558406808354_1605604312744&lang=ko&country=KR&objectId=651673_514&categoryId=&pageSize=15&indexSize=10&groupId=&listType=OBJECT&pageType=default&page=1&initialize=true&userType=&useAltSort=true&replyPageSize=10&_=1605604312745
这将返回填充页面中注释的Json,从而使您能够更直接地访问可能需要的数据

大多数查询参数都在收到的初始html响应中,但有一个查询参数不是<代码>\u callback=jquery1124008278558406808354\u 1605604312744

1605604312744
-是一个unix时间戳,使用
int now=Integer.parseInt(String.valueOf(LocalDateTime.now().toepochssecond(ZoneOffset.UTC))很容易获得

jQuery112408278558406808354
-很难理解这是如何计算的,但从脚本:

。。。
n、 延伸({
expando:“jQuery”+(m+Math.random()).replace(/\D/g,”),
...
。替换(/\D/g,”)
-删除所有非数字-因此是一个随机数

m
是脚本顶部的
“1.12.4”
(可能是使用中的jQuery版本)…因此我们在
1124+
<0.9999999…
(一些随机值)(删除
,因为它是非数字)后得到随机
参数值(小数点后16位)

这来自:

我尝试过这个,但没有成功。所以我有点困惑它是如何工作的。我在某个地方看到了一个.toLowerCase,当我在URL+查询参数上这样做时,我得到了一个“partner not Recognited”错误…显然有些不太正确


我会尝试使用
HtmlUnit
,因为它支持Javascript-这可能会使这更简单。

您解析的原始HTML是什么?我尝试解析此地址的HTML并获取注释。提供url并在
[jsoup]下签出一些其他答案
tag,正如我最近回答了许多关于如何执行此操作的描述一样……网络选项卡对于查看给定http请求的内容非常有用。您还可以提供您目前尝试使用的代码吗?感谢更新-现在将更容易查看