Python 如何获得全部<;a>;使用“类”标记;有名无实的;与美联图书馆?
我已经尝试过这个方法,但是即使它们是这个类的多个标记,我也只能从函数中获得一个元素。页面的大部分(实际上,大部分)都是用JavaScript呈现的,这一点从(相对)长时间等待文章加载就可以看出。Python 如何获得全部<;a>;使用“类”标记;有名无实的;与美联图书馆?,python,function,beautifulsoup,Python,Function,Beautifulsoup,我已经尝试过这个方法,但是即使它们是这个类的多个标记,我也只能从函数中获得一个元素。页面的大部分(实际上,大部分)都是用JavaScript呈现的,这一点从(相对)长时间等待文章加载就可以看出。requests模块不执行JavaScript,因此只有一个a.titular元素。您可以使用selenium,它等待JavaScript呈现,然后将页面源代码传递给bs4.BeautifulSoup() 导入bs4 >>>从selenium导入webdriver >>>browser=webdriver
requests
模块不执行JavaScript,因此只有一个a.titular
元素。您可以使用selenium
,它等待JavaScript呈现,然后将页面源代码传递给bs4.BeautifulSoup()
导入bs4
>>>从selenium导入webdriver
>>>browser=webdriver.Firefox()
>>>browser.get(“https://elperuano.pe/")
>>>soup=bs4.BeautifulSoup(browser.page\u content,features=“html.parser”)
>>>len(汤选(“有名无实”))
29
您必须安装selenium
:$pip安装selenium
仅供参考:
a.titular
选择器相当于a[class='titular']
选择器,它为CSS选择器列表选择所有。编辑您的问题,使其作为一个独立的问题。不要将源代码和数据作为图像发布。将这些作为问题的一部分以格式化文本发布。哦,当在关闭javascript的情况下浏览该页面时,Chrome说只有一个a
元素具有class名义
<代码>请求
不执行javascript。