Python 在使用jSoup抓取网站时,如何找到正确的选择器?

Python 在使用jSoup抓取网站时,如何找到正确的选择器?,python,java,web-scraping,netbeans,jsoup,Python,Java,Web Scraping,Netbeans,Jsoup,我目前正在学习如何进行web刮取,并正在使用jSoup来实现这一点。我阅读了jSoup食谱中关于如何做到这一点的内容,并遵循了它的步骤。我确保网站的源代码打印出来,确保工作正常且正确。但是当我必须找到一个选择器来循环浏览一个网站表时,我不知道该查找什么,或者选择什么。我将在下面留下我的代码,尽管我只是想知道要查找什么 String url = "https://www.centralcharts.com/en/price-list-ranking/ALL/asc/ts_29-us-nys

我目前正在学习如何进行web刮取,并正在使用jSoup来实现这一点。我阅读了jSoup食谱中关于如何做到这一点的内容,并遵循了它的步骤。我确保网站的源代码打印出来,确保工作正常且正确。但是当我必须找到一个选择器来循环浏览一个网站表时,我不知道该查找什么,或者选择什么。我将在下面留下我的代码,尽管我只是想知道要查找什么

    String url = "https://www.centralcharts.com/en/price-list-ranking/ALL/asc/ts_29-us-nyse-stocks--qc_1-alphabetical-order";
    Document doc = Jsoup.connect(url).userAgent("Jsoup Scraper").get();

    String stock = "tr:nth-of-type(1) > .footable-first-visible";
    Elements stockName = doc.select(stock);
    List<String> stocks = new ArrayList<String>();

    for (Element e : stockName) 
    {
        stocks.add(e.text());
    }

    for (String s : stocks) {
        System.out.println(s);
    }
stringurl=”https://www.centralcharts.com/en/price-list-ranking/ALL/asc/ts_29-us-nyse-stocks--qc_1-alphabetical-order";
Document doc=Jsoup.connect(url.userAgent(“Jsoup Scraper”).get();
String stock=“tr:nth of type(1)>.footable first visible”;
元素stockName=单据选择(库存);
列出股票=新的ArrayList();
用于(元素e:股票名称)
{
添加(如text());
}
用于(字符串s:股票){
系统输出打印项次;
}