Parsing Jsoup绝对路径
我正在努力获取从我的网站上抓取的图像的绝对路径。我已经查看了jsoup.org上的文档,但无法让abs:src正常工作。我不知道如何实现abs:src或者在哪里添加它Parsing Jsoup绝对路径,parsing,coldfusion,jsoup,Parsing,Coldfusion,Jsoup,我正在努力获取从我的网站上抓取的图像的绝对路径。我已经查看了jsoup.org上的文档,但无法让abs:src正常工作。我不知道如何实现abs:src或者在哪里添加它 <cfhttp method="get" url="https://theculturecook.com/recipe-slowroasted-pork-belly.html" result="theresult"> <cfscript> Jsoup = createObject("
<cfhttp method="get" url="https://theculturecook.com/recipe-slowroasted-pork-belly.html" result="theresult">
<cfscript>
Jsoup = createObject("java", "org.jsoup.Jsoup");
html = "#theresult.filecontent#";
doc = Jsoup.parse(html);
tags = doc.select("img[src$=.jpg]");
</cfscript>
<cfset images = "">
<cfloop index="e" array="#tags#">
<cfoutput>
<cfset images = ListAppend(images,#e.attr("src")#)>
</cfoutput>
</cfloop>
<cfloop list="#images#" index="a">
<cfoutput>#a#<br></cfoutput>
</cfloop>
Jsoup=createObject(“java”、“org.Jsoup.Jsoup”);
html=“#结果文件内容#”;
doc=Jsoup.parse(html);
tags=doc.select(“img[src$=.jpg]”);
#a#
您面临的问题是将html内容传递给JSOUP。如果您需要绝对路径,那么您需要使用to following进行连接
Jsoup.connect("https://theculturecook.com/recipe-slowroasted-pork-belly.html").get();
所以最后,
<cfscript>
Jsoup = createObject("java", "org.jsoup.Jsoup");
doc = Jsoup.connect("https://theculturecook.com/recipe-slowroasted-pork-belly.html").get();
tags = doc.select("img[src$=.jpg]");
</cfscript>
<!--- <cfdump var="#a.attr()#" abort> --->
<cfset images = "">
<cfloop index="e" array="#tags#">
<cfoutput>
<cfset images = ListAppend(images, e.attr("abs:src"))>
</cfoutput>
</cfloop>
<cfloop list="#images#" index="a">
<cfoutput>#a#<br></cfoutput>
</cfloop>
Jsoup=createObject(“java”、“org.Jsoup.Jsoup”);
doc=Jsoup.connect(“https://theculturecook.com/recipe-slowroasted-pork-belly.html).get();
tags=doc.select(“img[src$=.jpg]”);
#a#
是否可能重复?我尝试了那个解决方案,但我得到了一个错误“函数声明中缺少函数关键字”。是什么代码导致了那个错误?很好。JSoup需要一个“基本”url来解析内容中的相对路径。使用JSoup直接获取URL提供了该上下文。也可以使用重载方法手动完成:JSoup.parse(html,baseURL)