Python 3.x Python：在大量div中解析大量元素？_Python 3.x_Web Scraping_Beautifulsoup - Fatal编程技术网

Python 3.x Python：在大量div中解析大量元素？

python-3.x web-scraping

Python 3.x Python：在大量div中解析大量元素？,python-3.x,web-scraping,beautifulsoup,Python 3.x,Web Scraping,Beautifulsoup,我正在尝试解析一个网页，该网页看起来与BeautifulSoup类似我必须从带有类“quote mediumText”的每个div标记中提取我圈出的文本。您可以使用列表理解语法在一行中完成此任务： myList = [elem.text for elem in soup.findAll("div",{'class':'quoteText'})] 要获取链接中的红色圆圈文本，请尝试以下操作： import bs4 as bs import requests source = requests

我正在尝试解析一个网页，该网页看起来与BeautifulSoup类似

我必须从带有类“quote mediumText”的每个div标记中提取我圈出的文本。您可以使用列表理解语法在一行中完成此任务：

myList = [elem.text for elem in soup.findAll("div",{'class':'quoteText'})]

要获取链接中的红色圆圈文本，请尝试以下操作：

import bs4 as bs import requests source = requests.get("https://www.goodreads.com/quotes/tag/fear").text soup = bs.BeautifulSoup(source, "lxml") # Remove script tags. [s.extract() for s in soup('script')] divs = soup.findAll("div",{'class':'quoteText'}) for div in divs: print (div.text.replace('\n', ' ').replace('\r', ''))

更新以删除脚本标记换行符和回车符，
而不是elem.text和elem我必须放入div quoteText？否，请尝试执行这一行。它将提取
.findAll
返回列表中每个
.elem
元素的
.text
。它不应该，在图像中，圈出的文本有
class=“quoteText”
，但是你提到你想要带有
class=“quote mediumText”
的文本。哦，我明白了，我误解了你，使用了
类：“quoteText”
那么就应该这样做了。与上面丹·德夫的回答类似：）不用担心！不需要道歉这是你的代码？我已经做了你做的，但问题是做它你不需要olso文本，而是olso div中的其他东西你能给我一个例子吗？我不知道为什么它需要olso脚本中的数据tag://Updated 回答删除脚本标记换行符和回车符，

[web scraping]相关文章推荐

Web scraping 受恶意软件感染的站点列表（仅URL） web-scraping

Web scraping 如何抓取公开共享的秘密（Secret.ly）帖子 web-scraping web-crawler

Web scraping CasperJS在访问Google关键字规划器时挂断 web-scraping phantomjs

Web scraping 通过谷歌文档阻止网站抓取 web-scraping google-sheets

Web scraping 刮削：刮削嵌套链接 web-scraping scrapy

Web scraping 从蟒蛇身上刮下来 web-scraping

Web scraping 从网站中的多个页面提取表 web-scraping

Web scraping 使用Rvest表进行刮取时，头行的每一列都是奇数，数据的每一列都是偶数 web-scraping

Web scraping 需要Google Sheets ImportXML函数帮助 web-scraping google-sheets

随机文章推荐

如何将TFS 2008 CI生成限制为项目中的特定路径 tfs

在其他目录中获取特定版本的TFS代码 tfs

Tfs 为什么硒会产生这种错误？ tfs selenium selenium-webdriver

如何解锁其他计算机上其他开发人员锁定的TFS服务器文件 tfs

TFS 2010中的用例和用户故事 tfs

基于TFS中的另一个字段自动更改字段 tfs

TFS重新分支？ tfs

Tfs TF400018:本地版本表已锁定 tfs visual-studio-2012

仅当检入特定文件夹和子文件夹时触发生成-持续集成TFS tfs continuous-integration

tfs的服务器端事件处理程序 tfs

具有ReSharper清理代码的TFS签入策略 tfs resharper

Tfs 速度设置选项卡，在出现的对话框中选择Local或Server tfs

TFS 2013工作项字段设置为 tfs

有没有一种简单的方法可以打印TFS 2012中的Sprint燃尽图表？ tfs

Tfs OpsHub冻结是慢还是坏？ tfs azure-devops

Tfs 从MTM主动导出测试用例 tfs

TFS2015 tbl_含量增加 tfs

TFS/VSTS发布脚本变量操作顺序 tfs

2015年TFS建设&x201C；访问路径被拒绝”； tfs

TFS设置角色的权限大小写 tfs azure-devops

[python 3.x]相关推荐

Python 3.x 为Python 3.2配置Komodo编辑
Python 3.x

Python 3.x 如何从列表中删除包含特定元素的列表
Python 3.x

Python 3.x 尝试使用selenium和python加载chromedriver时遇到此错误
Python 3.x Selenium Webdriver

Python 3.x 测试/训练/验证大型数据集的拆分
Python 3.x Machine Learning

Python 3.x pyinstaller是否在可执行文件旁边添加文件夹？
Python 3.x

Python 3.x 如何使用python re在连续字符串中搜索数字/IP/整数地址？[没有空格]
Python 3.x

Python 3.x 如何排除数据帧中出现的特定日期？
Python 3.x Postgresql Pandas

Python 3.x XLSXWriter：将工作表添加到多页工作簿的开头，而不影响内部引用
Python 3.x Pandas

Python 3.x 获得；“成本”；google adward api与python
Python 3.x

Python 3.x I'；我对数学运算一窍不通
Python 3.x

Python 3.x 将字典的字符串表示形式解析为字典
Python 3.x String Dictionary

Python 3.x 大容量upsert存储过程
Python 3.x Azure Cosmosdb

Python 3.x 如何在for循环中创建以零开始的数字系列（格式）
Python 3.x

Python 3.x 矩阵位置
Python 3.x Matrix

Python 3.x 无法从QBO上载报告
Python 3.x Api

Python 3.x 按需获取方法生成的值
Python 3.x

Python 3.x python覆盖父行为，同时保留父方法和名称
Python 3.x

Python 3.x 在Python3中，哪些条件失败（如何检测哪些失败）？
Python 3.x If Statement Logging

Python 3.x 使用lxml插入解析的xml文件作为后续输出的元素
Python 3.x

Python 3.x 不要点击按钮
Python 3.x Selenium

Python 3.x 为什么在循环中使用变量和数字会显示不同的结果
Python 3.x List Loops

Python 3.x 以下python 3.8字典中的最大值及其键
Python 3.x

Python 3.x 如何使按钮中的函数中的旧消息消失，并在函数中显示新消息
Python 3.x Tkinter

Python 3.x 根据其索引，仅对某些行应用映射
Python 3.x Pandas

Python 3.x 您好，我想在数据框中创建第二列，只使用第一列的特定值
Python 3.x Pandas Dataframe

Python 3.x 如果输入的值错误，如何返回菜单？
Python 3.x

Python 3.x 反向整数python
Python 3.x

Python 3.x 在字典中合并两个列表，保留具有多个值的键的重复值
Python 3.x List Dictionary

Python 3.x Can'；t将自定义模块导入测试
Python 3.x

Python 3.x comapre两个数据帧并基于匹配添加特定列值
Python 3.x Pandas

Tags

Drop Down Menu Google Cloud Platform Glassfish Zend Framework Excel Reflection Editor Silverlight 4.0 Oop Audio Ios8 Uml Oracle10g Asp.net Mvc 2 Docusignapi .net Asp.net Web Api Latex Ravendb Gps Templates Ssis Stored Procedures Joomla Tridion Shell Gmail Webpack Datetime Sql Server 2012 Keyboard Elixir Oracle Apex Grep Recursion Process Ruby Doctrine Orm Ldap Curl Data Structures Django Models Jetty Android Studio Join Botframework Sprite Kit Email Ip Xampp Mdx Air Visual Studio 2015 Windbg Text Speech Recognition Plone Testing Loopbackjs Graph Bazel Deployment Plot Plugins Kendo Ui Google Visualization Robotframework Ubuntu Fiware Cuda Signalr Corda Tags Outlook Linux Unit Testing Ignite Xamarin.forms Openshift Highcharts Seo Heroku Interface Documentation Coding Style Dom Search Ssas Codenameone Ibm Mobilefirst Elm Artifactory Html5 Canvas Spring Cloud Amazon Ec2 Ios5 Swift3 Sapui5 Glsl Apache2 Sqlite Ms Access Grails Discord.js Cucumber Asp.net Mvc 4 Office Js Indexing Linker Android Ndk Ipad Here Api Orm Build Parsing Notepad++ Pointers Weblogic If Statement Flash Streaming Django Delphi Timer Microsoft Graph Api Programming Languages Post Reference Project Management R Java Me Jqgrid Mediawiki .htaccess Parallel Processing Web Crawler Laravel Floating Point Smalltalk Listview Virtual Machine Ckeditor Ftp Winapi C++11 Kubernetes Lotus Notes Jakarta Ee Prolog Terraform C# Macos Compiler Construction Express Libgdx Algorithm Google Maps Azure Functions Mqtt Mod Rewrite Xcode4 Dns Selenium Compilation Xamarin.ios Razor Jersey Amazon Web Services Sqlalchemy Aws Lambda Gwt Go Keras Https Triggers Spotify Routing Antlr Typescript Cypress Qml Db2 Asterisk Validation Artificial Intelligence Google Chrome Extension Gulp Cygwin Angular Jquery Ui Pascal Numpy Jmeter Sbt Sharepoint 2007 Youtube Api Amp Html Fluent Nhibernate Hybris Qt Actions On Google

Copyright © 2024. All Rights Reserved by - Fatal编程技术网