Python 3.x 如何使用BeautifulSoup/Python提取网页脚本的结果
我正在尝试编写一个Python程序,使用BeautifulSoup在给定产品编号的情况下,在web上搜索产品名称。我正在使用此页面作为示例:。理想情况下,我会从这个页面中提取字符串“DAIRY COMPLEX NATURAL”,以及该链接的URL 我刚刚开始使用BeautifulSoup,但到目前为止,我找到的最接近我要查找的标记是使用soup.find('p'),它显示了一个我不知道如何解析结果的脚本 我真的很感激你们能提供的任何帮助 编辑以下是我认为包含我想要的信息的脚本的代码:Python 3.x 如何使用BeautifulSoup/Python提取网页脚本的结果,python-3.x,web-scraping,beautifulsoup,Python 3.x,Web Scraping,Beautifulsoup,我正在尝试编写一个Python程序,使用BeautifulSoup在给定产品编号的情况下,在web上搜索产品名称。我正在使用此页面作为示例:。理想情况下,我会从这个页面中提取字符串“DAIRY COMPLEX NATURAL”,以及该链接的URL 我刚刚开始使用BeautifulSoup,但到目前为止,我找到的最接近我要查找的标记是使用soup.find('p'),它显示了一个我不知道如何解析结果的脚本 我真的很感激你们能提供的任何帮助 编辑以下是我认为包含我想要的信息的脚本的代码: <p
<p><script>// <![CDATA[
(function () {
var frameBaseSRC = document.getElementById("results").src;
var frameQueryString = document.location.href.split("?q=")[1];
if (frameQueryString != undefined) {
document.getElementById("results").src = frameBaseSRC + "?q=" + frameQueryString;
}
})();
这给了我上面的脚本文本
对不起,如果我不清楚,我已经花了几个小时阅读,但是所有的链接都是紫色的,我觉得我遗漏了一些简单的东西。如果您在浏览器中检查网络流量(检查>网络),您会注意到,搜索结果内容是通过请求
http://prod.adv-bio.com/SearchResults.aspx?q=1081
因此,您可以使用该url
url = "http://prod.adv-bio.com/SearchResults.aspx?q=1081"
r = requests.get(url)
soup = BeautifulSoup(r.content, 'html.parser')
a = soup.find('a', {'id':'SearchGridView_ctl02_hlProdDetails'})
text, link = a.text, a.get('href')
如果您在浏览器中检查网络流量(检查>网络),您会注意到搜索结果内容是通过请求
http://prod.adv-bio.com/SearchResults.aspx?q=1081
因此,您可以使用该url
url = "http://prod.adv-bio.com/SearchResults.aspx?q=1081"
r = requests.get(url)
soup = BeautifulSoup(r.content, 'html.parser')
a = soup.find('a', {'id':'SearchGridView_ctl02_hlProdDetails'})
text, link = a.text, a.get('href')
请将相关代码添加到您的问题。@t.m.adam是否更清晰?请将相关代码添加到您的问题。@t.m.adam是否更清晰?