Python 美化组定位iframe及其属性

Python 美化组定位iframe及其属性,python,beautifulsoup,Python,Beautifulsoup,我得去喝一碗靓汤 <div class="divclass"> <div id="simpleid"> <iframe width="300" height="300" src="http://google.com> 但是硒对于这个任务来说太慢了 我一直在这里寻找stackoverflow的解决方案,并尝试了几个代码,但在使用urllib时总是出现错误403(更改浏览器代理不起作用,仍然是403错误),或者出现“无”或“使用soup.find_all”

我得去喝一碗靓汤

<div class="divclass">
 <div id="simpleid">
  <iframe width="300" height="300" src="http://google.com>
但是硒对于这个任务来说太慢了

我一直在这里寻找stackoverflow的解决方案,并尝试了几个代码,但在使用urllib时总是出现错误403(更改浏览器代理不起作用,仍然是403错误),或者出现“无”或“使用soup.find_all”(“要搜索的标记”)

>>来自bs4导入组
>>>html=“”
... 
...  
...   
... '''
>>>soup=BeautifulSoup(html,'html.parser')
>>>汤。查找所有('iframe'))
[
]
>>>soup.find_all('iframe')[0]['src']
u'http://google.com'
>>> 
问得好。 查看您试图通过使用该库获取iframe的站点,您必须获取该div中标记的内容,然后base64对其进行解码,您应该这样做。
看看你是怎么做的,不要停下来!你将成为一名优秀的程序员。

以前尝试过,但它只找到较小的带有广告的iframe,我想要的是打印为空的[]如果你能提供链接,或者可能是一段代码,那就太好了。我不确定你的代码出了什么问题,但我想这是最好的方法。首先,网站被封锁了,所以我想我在这里无能为力(根据我的ISP)。您可以尝试检查是否可以修改任何内容,否则您可以使用regex方法,这有点难。find_all()函数仍然应该工作。soup中“[0]的用途是什么。find_all('iframe')[0]['src']?find_all返回值列表,因此您需要通过[0]访问第一次出现的值,最好的办法是,如果您想要第一次出现,只需键入soup。find('iframe')为此,您不必指定[0]
iframe1 = driver.find_element_by_class_name("divclass")
iframe = iframe1.find_element_by_tag_name("iframe").get_attribute("src")
>>> from bs4 import BeautifulSoup
>>> html = '''
... <div class="divclass">
...  <div id="simpleid">
...   <iframe width="300" height="300" src="http://google.com">
... '''
>>> soup = BeautifulSoup(html, 'html.parser')
>>> soup.find_all('iframe')
[<iframe height="300" src="http://google.com" width="300">
</iframe>]
>>> soup.find_all('iframe')[0]['src']
u'http://google.com'
>>>