Python 3.x 如何使用BeautifulSoup/Python提取网页脚本的结果_Python 3.x_Web Scraping_Beautifulsoup

Python 3.x 如何使用BeautifulSoup/Python提取网页脚本的结果

python-3.x web-scraping

Python 3.x 如何使用BeautifulSoup/Python提取网页脚本的结果,python-3.x,web-scraping,beautifulsoup,Python 3.x,Web Scraping,Beautifulsoup,我正在尝试编写一个Python程序，使用BeautifulSoup在给定产品编号的情况下，在web上搜索产品名称。我正在使用此页面作为示例：。理想情况下，我会从这个页面中提取字符串“DAIRY COMPLEX NATURAL”，以及该链接的URL 我刚刚开始使用BeautifulSoup，但到目前为止，我找到的最接近我要查找的标记是使用soup.find（'p'），它显示了一个我不知道如何解析结果的脚本我真的很感激你们能提供的任何帮助编辑以下是我认为包含我想要的信息的脚本的代码： <p

我正在尝试编写一个Python程序，使用BeautifulSoup在给定产品编号的情况下，在web上搜索产品名称。我正在使用此页面作为示例：。理想情况下，我会从这个页面中提取字符串“DAIRY COMPLEX NATURAL”，以及该链接的URL

我刚刚开始使用BeautifulSoup，但到目前为止，我找到的最接近我要查找的标记是使用soup.find（'p'），它显示了一个我不知道如何解析结果的脚本

我真的很感激你们能提供的任何帮助

编辑以下是我认为包含我想要的信息的脚本的代码：

<p><script>// <![CDATA[
    (function () {
        var frameBaseSRC = document.getElementById("results").src;
        var frameQueryString = document.location.href.split("?q=")[1];
        if (frameQueryString != undefined) {
            document.getElementById("results").src = frameBaseSRC + "?q=" + frameQueryString;
        }
    })();

这给了我上面的脚本文本

对不起，如果我不清楚，我已经花了几个小时阅读，但是所有的链接都是紫色的，我觉得我遗漏了一些简单的东西。

如果您在浏览器中检查网络流量（检查>网络），您会注意到，搜索结果内容是通过请求

http://prod.adv-bio.com/SearchResults.aspx?q=1081

因此，您可以使用该url

url = "http://prod.adv-bio.com/SearchResults.aspx?q=1081"
r = requests.get(url)
soup = BeautifulSoup(r.content, 'html.parser')
a = soup.find('a', {'id':'SearchGridView_ctl02_hlProdDetails'})
text, link = a.text, a.get('href')

如果您在浏览器中检查网络流量（检查>网络），您会注意到搜索结果内容是通过请求

http://prod.adv-bio.com/SearchResults.aspx?q=1081

因此，您可以使用该url

url = "http://prod.adv-bio.com/SearchResults.aspx?q=1081"
r = requests.get(url)
soup = BeautifulSoup(r.content, 'html.parser')
a = soup.find('a', {'id':'SearchGridView_ctl02_hlProdDetails'})
text, link = a.text, a.get('href')

请将相关代码添加到您的问题。@t.m.adam是否更清晰？请将相关代码添加到您的问题。@t.m.adam是否更清晰？