Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/292.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 使用两个不同的div类查找数据_Python_Html_Beautifulsoup - Fatal编程技术网

Python 使用两个不同的div类查找数据

Python 使用两个不同的div类查找数据,python,html,beautifulsoup,Python,Html,Beautifulsoup,我正在尝试解析这个html网页,我想要网页中的特定数据。我在这个特定的类上使用findall函数。唯一的问题是,由于类冲突,它会在网站一侧拾取不必要的数据。我主要想对包含mainContent和item类名的div类进行findall。我只找到了如何查找包含blank或blank的类。如果试图查找类名为blank和blank的对象,语法会是什么?谢谢大家! 使用而不是全部查找: #! /usr/bin/env python3 # -*- coding: UTF8 -*-from bs4 impo

我正在尝试解析这个html网页,我想要网页中的特定数据。我在这个特定的类上使用findall函数。唯一的问题是,由于类冲突,它会在网站一侧拾取不必要的数据。我主要想对包含mainContent和item类名的div类进行findall。我只找到了如何查找包含blank或blank的类。如果试图查找类名为blank和blank的对象,语法会是什么?谢谢大家!

使用而不是全部查找:

#! /usr/bin/env python3
# -*- coding: UTF8 -*-from bs4 import BeautifulSoup

html_doc = """
<!DOCTYPE html>
<html lang="en-US">
<head>
  <title>test</title>
</head>
<body>
  <div class="alpha">not a match.</div>
  <div class="beta">not a match.</div>
  <div class="alpha beta">match.</div>
  <div class="beta alpha">match.</div>
  <p class="alpha beta">not match.</div>
</body>
</html>
"""

soup = BeautifulSoup(html_doc, 'html.parser')

print(soup.select("div.alpha.beta"))

或者,我如何获得这个特定div中的所有子类?基本上,有一个div标记,其id为mainContent。我只想要标签上的所有东西。我确信这会起作用,但我仍然无法检索数据。你还有什么想法可以给我吗?那是另一个问题。这是一个很好的实践,包括我所拥有的,以及我期望在你们的问题中得到的结果。soup.selectdivmain内容