Web scraping 如何从重定向链接中刮取url？_Web Scraping_Beautifulsoup_Python Requests

Web scraping 如何从重定向链接中刮取url？

web-scraping

Web scraping 如何从重定向链接中刮取url？,web-scraping,beautifulsoup,python-requests,Web Scraping,Beautifulsoup,Python Requests,我正在尝试从一个页面获取链接，我已经获取了按钮中包含的数据url，当单击该按钮时，网站将加载url=something.com/api？call=XXXXXX&auth=XXX 然后转到真正的网站anotherweb.com 所以我想，如果我请求URL，我可能会访问另一个web.com，它成功了代码： import requests import urllib.error , urllib.request , urllib.parse #import time from bs4 import

我正在尝试从一个页面获取链接，我已经获取了按钮中包含的

数据url

，当单击该按钮时，网站将加载

url=something.com/api？call=XXXXXX&auth=XXX

然后转到真正的网站

anotherweb.com

所以我想，如果我请求

URL

，我可能会访问另一个web.com，它成功了

代码：

import requests
import urllib.error , urllib.request , urllib.parse
#import time
from bs4 import BeautifulSoup

url = input('https://nova.egybest.bid/movie/extraction-2020')

id = url.split('/')[2]



url = requests.get(url).text
api_urls = []

soup = BeautifulSoup( url ,'lxml' )
table_url = soup.find('table' , class_='dls_table btns full mgb')
all = table_url.find_all('a' , class_= 'nop btn g dl _open_window')
for link in all:
   api_url = link['data-url']
   api_urls.append(api_url)

#Query para [call , auth]
for req in api_urls :
    http = 'http://' + id
    #time.sleep(4)
    new_url = requests.get(http + req)
    #time.sleep(3)
    print(new_url.url)

一段时间后，它不起作用，相反，程序会打印

id

（加载主页）

有没有办法获取另一个网站的实际url

anotherweb.com

没关系，我刚被禁了

注意：

id

是页面域

something.com

您的问题不清楚，请回答您的问题并尽可能提供更多详细信息，以便能够理解您的问题！你的问题还不清楚，但我似乎能够理解你的目标。如果您使用了

allow_redirects=False

，那么您将获得主url，这意味着它将关闭重定向。因为默认情况下，

response.url

将为您提供

url

的结尾，每当网站重定向时，默认情况下会打开重定向。我想直接进入该页面，但使用

请求。获取（url）

进入主页。。我可以在pastbin中发布代码吗？你可以在问题中发布代码。点击添加代码与链接，你可以看到有5个按钮，5个不同的链接/决议的电影，当你点击一个，你被重定向到视频…com页面，我想刮你的问题不清楚，请你的问题，并包括更多的细节，因为你可以理解你的问题！你的问题还不清楚，但我似乎能够理解你的目标。如果您使用了

allow_redirects=False

，那么您将获得主url，这意味着它将关闭重定向。因为默认情况下，

response.url

将为您提供

url

的结尾，每当网站重定向时，默认情况下会打开重定向。我想直接进入该页面，但使用

请求。获取（url）

进入主页。。我可以在pastbin中发布代码吗？你可以在问题中发布代码。点击添加代码与链接，你可以看到有5个按钮，5个不同的链接/决议的电影，当你点击一个，你被重定向到视频…com页面，我想刮该网址