如何从Java主页(包括jsoup)中抓取某个项目

如何从Java主页(包括jsoup)中抓取某个项目,java,web-scraping,jsoup,Java,Web Scraping,Jsoup,下面我有代码刮一个yelp页面。我只需要从控制台的网站Url。因此,只有在本例中,url“cube rieger.de”(在noopener nofollow之后) 有人能帮我解决这个问题吗?我猜您正在寻找元素。text(),如上所述。这应该会回来 cube-rieger.de 那么您的意思是用Element.text()替换noopener nofollow?如果您对元素的文本值感兴趣,应该调用link.text()要获取相应的文本,请提供一个示例?我什么都试过了。 <a href=&q

下面我有代码刮一个yelp页面。我只需要从控制台的网站Url。因此,只有在本例中,url“cube rieger.de”(在noopener nofollow之后)


有人能帮我解决这个问题吗?

我猜您正在寻找
元素。text()
,如上所述。这应该会回来

cube-rieger.de


那么您的意思是用Element.text()替换noopener nofollow?如果您对元素的文本值感兴趣,应该调用
link.text()
要获取相应的文本,请提供一个示例?我什么都试过了。
<a href="/biz_redir?url=http%3A%2F%2Fwww.cube-rieger.de&amp;website_link_type=website&amp;src_bizid=q_PKB5C34yMiQ8JfvN2gkg&amp;cachebuster=1573659980&amp;s=80a10c01ecab48c960a0145decb9e8f8c7502d7f239f5a799568cfe9ec1748bd" target="_blank" rel="noopener nofollow">cube-rieger.de</a>
package methoden;

import java.io.IOException;

import org.jsoup.*;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;

public class JsoupRun {

        public static void main(String[] args) throws IOException {

            String url = "https://www.yelp.com/biz/zahn%C3%A4rzte-dr-g-cube-dr-r-cube-"
                    + "und-dr-d-rieger-stuttgart?adjust_creative=LkD6tqXBfUmRYWw5Kapg"
                    + "6Q&utm_campaign=yelp_api_v3&utm_medium=api_v3_business_search&"
                    + "utm_source=LkD6tqXBfUmRYWw5Kapg6Q";

            Document document = Jsoup.connect(url).get();
            Elements links = document.select("noopener nofollow");

            for (Element link : links) {

                System.out.println("link : " + link.attr("href"));
                System.out.println("text : " + link.text());
            }
        }
    }