使用Java进行刮取/提取,结果来自coinmarketcap.com

使用Java进行刮取/提取,结果来自coinmarketcap.com,java,web-scraping,jsoup,htmlunit,Java,Web Scraping,Jsoup,Htmlunit,我需要用Java从页面顶部提取coinmarket cap volume(例如:市值:$306020249332),请参见所附图片 我在JavaEclipse中使用了jsoup库,但没有提取卷。Jsoup只提取其他属性。问题可能来自java脚本库 我还使用了html单元,但没有成功: import java.io.IOException; import java.util.List; import com.gargoylesoftware.htmlunit.WebClient; import

我需要用Java从页面顶部提取coinmarket cap volume(例如:市值:$306020249332),请参见所附图片

我在JavaEclipse中使用了jsoup库,但没有提取卷。Jsoup只提取其他属性。问题可能来自java脚本库

我还使用了html单元,但没有成功:

import java.io.IOException;
import java.util.List;

import com.gargoylesoftware.htmlunit.WebClient;
import com.gargoylesoftware.htmlunit.html.HtmlAnchor;
import com.gargoylesoftware.htmlunit.html.HtmlPage;

public class Testss {
    public static void main(String\[\] args) throws IOException {

        String url = "https://coinmarketcap.com/faq/";

        WebClient client = new WebClient();
        HtmlPage page = client.getPage(url);
        List<?> anchors = page.getByXPath("//div\[@class='col-sm-6 text-center'\]//a");
        for (Object obj : anchors) {
            HtmlAnchor a = (HtmlAnchor) obj;
            System.out.println(a.getTextContent().trim());
        }
    }
}
import java.io.IOException;
导入java.util.List;
导入com.gargoylesoftware.htmlunit.WebClient;
导入com.gargoylesoftware.htmlunit.html.HtmlAnchor;
导入com.gargoylesoftware.htmlunit.html.HtmlPage;
公共类测试{
公共静态void main(字符串\[\]args)引发IOException{
字符串url=”https://coinmarketcap.com/faq/";
WebClient客户端=新的WebClient();
HtmlPage=client.getPage(url);
列表锚=page.getByXPath(“//div\[@class='col-sm-6文本中心'\]//a”);
对于(对象对象对象:锚定){
HtmlAnchor a=(HtmlAnchor)obj;
System.out.println(a.getTextContent().trim());
}
}
}
如何使用Java从该站点提取卷


谢谢

检查“网络”选项卡,查找获取数据的确切请求(在您的案例中是它的请求)

此外,请求URL如下所示

因此,获取主URL并不能满足您的需求,因为您必须直接从请求URL获取数据,并使用任何JSON库对其进行解析SimpleJSON我可以在其中一个方面提出建议

点击url后将获得的JSON数据

{
“比特币占市场份额的百分比”:55.95083004655126,
“主动加密货币”:1324,
“总量”美元:2150093761,
“活跃市场”:7009,
“按可用供应量计算的总市值”:30110436864
}