如何从Java主页(包括jsoup)中抓取某个项目
下面我有代码刮一个yelp页面。我只需要从控制台的网站Url。因此,只有在本例中,url“cube rieger.de”(在noopener nofollow之后)如何从Java主页(包括jsoup)中抓取某个项目,java,web-scraping,jsoup,Java,Web Scraping,Jsoup,下面我有代码刮一个yelp页面。我只需要从控制台的网站Url。因此,只有在本例中,url“cube rieger.de”(在noopener nofollow之后) 有人能帮我解决这个问题吗?我猜您正在寻找元素。text(),如上所述。这应该会回来 cube-rieger.de 那么您的意思是用Element.text()替换noopener nofollow?如果您对元素的文本值感兴趣,应该调用link.text()要获取相应的文本,请提供一个示例?我什么都试过了。 <a href=&q
有人能帮我解决这个问题吗?我猜您正在寻找
元素。text()
,如上所述。这应该会回来
cube-rieger.de
那么您的意思是用Element.text()替换noopener nofollow?如果您对元素的文本值感兴趣,应该调用
link.text()
要获取相应的文本,请提供一个示例?我什么都试过了。
<a href="/biz_redir?url=http%3A%2F%2Fwww.cube-rieger.de&website_link_type=website&src_bizid=q_PKB5C34yMiQ8JfvN2gkg&cachebuster=1573659980&s=80a10c01ecab48c960a0145decb9e8f8c7502d7f239f5a799568cfe9ec1748bd" target="_blank" rel="noopener nofollow">cube-rieger.de</a>
package methoden;
import java.io.IOException;
import org.jsoup.*;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;
public class JsoupRun {
public static void main(String[] args) throws IOException {
String url = "https://www.yelp.com/biz/zahn%C3%A4rzte-dr-g-cube-dr-r-cube-"
+ "und-dr-d-rieger-stuttgart?adjust_creative=LkD6tqXBfUmRYWw5Kapg"
+ "6Q&utm_campaign=yelp_api_v3&utm_medium=api_v3_business_search&"
+ "utm_source=LkD6tqXBfUmRYWw5Kapg6Q";
Document document = Jsoup.connect(url).get();
Elements links = document.select("noopener nofollow");
for (Element link : links) {
System.out.println("link : " + link.attr("href"));
System.out.println("text : " + link.text());
}
}
}