如何从Java主页（包括jsoup）中抓取某个项目_Java_Web Scraping_Jsoup

如何从Java主页（包括jsoup）中抓取某个项目

java web-scraping

如何从Java主页（包括jsoup）中抓取某个项目,java,web-scraping,jsoup,Java,Web Scraping,Jsoup,下面我有代码刮一个yelp页面。我只需要从控制台的网站Url。因此，只有在本例中，url“cube rieger.de”（在noopener nofollow之后）有人能帮我解决这个问题吗？我猜您正在寻找元素。text（），如上所述。这应该会回来 cube-rieger.de 那么您的意思是用Element.text（）替换noopener nofollow？如果您对元素的文本值感兴趣，应该调用link.text（）要获取相应的文本，请提供一个示例？我什么都试过了。 <a href=&q

下面我有代码刮一个yelp页面。我只需要从控制台的网站Url。因此，只有在本例中，url“cube rieger.de”（在noopener nofollow之后）

有人能帮我解决这个问题吗？

我猜您正在寻找

元素。text（）

，如上所述。这应该会回来

cube-rieger.de

那么您的意思是用Element.text（）替换noopener nofollow？如果您对元素的文本值感兴趣，应该调用

link.text（）

要获取相应的文本，请提供一个示例？我什么都试过了。

<a href="/biz_redir?url=http%3A%2F%2Fwww.cube-rieger.de&amp;website_link_type=website&amp;src_bizid=q_PKB5C34yMiQ8JfvN2gkg&amp;cachebuster=1573659980&amp;s=80a10c01ecab48c960a0145decb9e8f8c7502d7f239f5a799568cfe9ec1748bd" target="_blank" rel="noopener nofollow">cube-rieger.de</a>

package methoden;

import java.io.IOException;

import org.jsoup.*;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;

public class JsoupRun {

        public static void main(String[] args) throws IOException {

            String url = "https://www.yelp.com/biz/zahn%C3%A4rzte-dr-g-cube-dr-r-cube-"
                    + "und-dr-d-rieger-stuttgart?adjust_creative=LkD6tqXBfUmRYWw5Kapg"
                    + "6Q&utm_campaign=yelp_api_v3&utm_medium=api_v3_business_search&"
                    + "utm_source=LkD6tqXBfUmRYWw5Kapg6Q";

            Document document = Jsoup.connect(url).get();
            Elements links = document.select("noopener nofollow");

            for (Element link : links) {

                System.out.println("link : " + link.attr("href"));
                System.out.println("text : " + link.text());
            }
        }
    }