Python 如何在出现错误消息的情况下继续刮取_Python_Web Scraping - Fatal编程技术网

Python 如何在出现错误消息的情况下继续刮取

python web-scraping

Python 如何在出现错误消息的情况下继续刮取,python,web-scraping,Python,Web Scraping,我正在运行我的网页抓取脚本，它收集了数千个数据。问题是当出现错误时，它会一直停止。我希望它只记录错误并继续下一个url。以下是我目前关于例外的情况 uClient3 = '' while uClient3 == '': try: uClient3 = requests.get(fsgsubcard2ref) print("Proceding to the next level in...") except: print("Connec

我正在运行我的网页抓取脚本，它收集了数千个数据。问题是当出现错误时，它会一直停止。我希望它只记录错误并继续下一个url。以下是我目前关于例外的情况

uClient3 = ''
while uClient3 == '':
    try:
       uClient3 = requests.get(fsgsubcard2ref)
       print("Proceding to the next level in...")

    except:
        print("Connection refused by the server..")
        print("Let me sleep for 7 seconds")
        print("ZZzzzz...")
        time.sleep(8)
        print("Was a nice sleep, now let me continue...")

        continue

如何防止错误停止脚本并记录它

在

uClient3=requests.get（fsgsubcard2ref）

之后，

uClient3

将被存储

Response

对象，而uClient3==''将返回

False

。我这边最好的方法是使用for循环：

for i in fsgsubcard2ref: # fsgsubcard2ref should be a list() with all url, or you can can use variable with another name
    try:
        response = requests.get(i)
        # processing
    except:
        print('Error')

你的代码缩进得很厉害。

continue

语句属于哪里？除了之外，

是否确实按照您发布错误的方式缩进？并添加错误的堆栈跟踪。这是一个错误吗？你的try语句不应该退出循环我已经修复了indentation@DYZrequests.get（'https://stackoverflow.com）
returnResponse
object，而不是str
。和而uClient3=''
由于响应，每次都将为False
fsgsubcars2ref似乎是一个url。因此，您将对url中的每个字符发出HTTP请求，每次都会失败并出现打印错误。我添加了一条注释，即fsgsubcard2ref
应该是一个包含所有url的列表




[web scraping]相关文章推荐



                                                        
Web scraping 需要从根站点开始提取数据
web-scraping 
Web scraping iMacros——使用Javascript站点从站点提取特定文本
web-scraping 
Web scraping 用刮刀刮网
web-scrapingscrapy 
Web scraping 如何仅从特定类别抓取带有scrapy的链接，而忽略产品页面上的链接？
web-scrapingscrapy 
Web scraping 如何从网站上获取所有数据？
web-scrapingscrapy 
Web scraping 当我找到值时，如何停止web抓取数据？
web-scraping 
Web scraping 从URL触发按钮单击
web-scrapingcoldfusion 
Web scraping 使用BeautifulSoup解析和提取熊猫数据
web-scraping 
Web scraping Can'；无法获取属性元素的内部文本
web-scraping 
Web scraping Rvest不会返回数据
web-scraping 
Web scraping 为什么木偶人似乎在随机化数据？
web-scraping 
Web scraping page.close（）不会停止ui4j活动和定期重新加载网页
web-scraping 
                                       





随机文章推荐



                                                        
TINYMCE自定义链接属性
tinymce 
TinyMCE图像编辑器集成
tinymce 
Tinymce+MCImageManager将随机字符串附加到上载的文件名中
tinymce 
如何在同一表单中启用多个TinyMCE
tinymce 
将表格html标记粘贴到tinymce文本框
tinymce 
Tinymce Ajax文件/图像管理器
tinymce 
ApacheWicket-从TinyMceBehavior获取光标位置
tinymcewicket 
prestashop:无法在tinymce中插入图像
tinymceprestashop 
TinyMCE插件不显示欧元符号
tinymce 
TinyMCE从<；span>；及<；i>；元素
tinymce 
tinyMCE更改事件正在工作，但未隐藏文本区域'；s
tinymce 
TinyMCE 5：插入blockquote元素时，始终向其添加类（通过单击工具栏上的“blockquote”按钮）
tinymce 
如何为列表指定默认CSS类<；ul>；在TinyMCE？
tinymce


                                        

                                        
                                        


                                                
                                                        [python]相关推荐
                                                        
Python html中的CherryPy变量
									Python
							 
Python：如何在自定义范围中使用“exec”？
									Python
							 
Python 我试图写入txt.file的函数有什么问题？
									Python
							 									Python 2.7
							 
Python正则表达式在匹配的元素中与一个正则表达式匹配
									Python
							 									Regex
							 
升华：更改插件使用的Python版本
									Python
							 									Macos
							 									Sublimetext2
							 
Python 使用openpyxl保存修改后的工作簿时出现关键错误
									Python
							 
Python请求，访问API时不断出现401错误
									Python
							 									Django
							 									Api
							 
Python 在两个用户输入字母之间打印字母表
									Python
							 
Python 如何在matplotlib绘图中使用自定义TeX字体
									Python
							 									Fonts
							 									Matplotlib
							 
自修改Python类
									Python
							 									Class
							 
Python Pyplot.imshow（）和Pyplot.show（）间歇性显示
									Python
							 									Matplotlib
							 
Python 我的翻译不承认十二月是冬季月份（如果/否则）
									Python
							 									If Statement
							 									Pycharm
							 
在使用askopenfilename通过单击按钮获取文件名之后，如何在python中的条目中显示该文件名
									Python
							 									Tkinter
							 
意外的python计数器值
									Python
							 
Python TensorFlow:生成pip包时出错
									Python
							 									Tensorflow
							 
Python Django自定义管理面板站点设置
									Python
							 									Django
							 
如何向python回调传递附加参数？
									Python
							 									Python 3.x
							 
基于python中的2列选择DF中的特定行
									Python
							 									Pandas
							 
Python 使用dataframe方法按名称列出的小写列
									Python
							 									Pandas
							 
Python 从models.py迁移数据时出现问题
									Python
							 									Django
							 									Django Models
							 
Python 关于硒是可见的
									Python
							 									Selenium Webdriver
							 
Python SQLAlchemy-从表定义中删除列
									Python
							 									Sqlalchemy
							 
如何单击Python OpenCV检测到的边？
									Python
							 									Opencv
							 									Image Processing
							 
如何在python中获取给定输入文件的所有列表的所有标记的长度？
									Python
							 									String
							 									Python 3.x
							 									List
							 									File
							 
Python -：“int”和“function”的操作数类型不受支持
									Python
							 
Python 如何将潜在变量输入到TensorFlow图中？
									Python
							 									Variables
							 									Tensorflow
							 
等待文件完全创建完毕，然后在python中继续
									Python
							 									Linux
							 
Python 从列表中，如何从特定字符串打印到特定字符串
									Python
							 
Python 将整型转换为字符串
									Python
							 
Python 将字符串拆分为Ysubn字符串
									Python
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Sqlalchemy
Testing
Azure Devops
Discord.py
Stored Procedures
Ravendb
Canvas
Amazon Ec2
Appium
Apache Flex
Amazon Web Services
Triggers
Data Structures
Open Source
Windows Services
Fluent Nhibernate
Linux
Swing
F#
Filter
Recursion
Matrix
Search
Less
Multithreading
Macros
Graphics
Pandas
Logstash
Abap
Netty
Vagrant
Graphviz
R
React Native
Express
Button
Ssrs 2008
Subsonic
Cuda
Emacs
Ruby
Cmake
Fortran
Jdbc
Json
Sql Server 2008
Mariadb
Ms Word
Xamarin.forms
Audio
Primefaces
Mapping
Memory Leaks
Sockets
Unity3d
Synchronization
Visual Studio 2013
Titanium
Microservices
Hash
Silverstripe
Html5 Canvas
Lisp
Jetty
Url Rewriting
Apache Pig
Colors
Python Sphinx
Openerp
Amazon S3
Nest
Nginx
Log4net
Android Layout
Google Cloud Firestore
Plugins
X86
Model
Typo3
Spotify
Certificate
Computer Science
Itext
Aframe
Spring Integration
Sharepoint 2013
Permissions
Fullcalendar
Ruby On Rails
C# 3.0
Vaadin
Moodle
Scala
Virtualbox
Assembly
Datatables
Chef Infra
Camera
Dojo
Google Visualization
Firefox
Tags
Jar
Templates
Erlang
Amazon Cloudformation
Module
Requirejs
Kentico
Apache Kafka
Drop Down Menu
Compilation
Sphinx
Objective C
Serialization
Dynamic
Actionscript 3
Tcl
Autodesk Forge
Weblogic
Selenium
Jakarta Ee
Binding
Curl
Ionic2
Activerecord
Amp Html
Identityserver4
Salesforce
Tinymce
Logic
Telegram
Uitableview
Download
Sorting
Mercurial
Monitoring
Operating System
Windbg
Cocoa
Debugging
Google Apps Script
Google Calendar Api
C#
Autocomplete
Arangodb
Verilog
Jquery Mobile
Openstack
Time Complexity
Process
Openid
Docker
Octave
Oracle10g
Google Chrome
Sugarcrm
Parameters
Import
Vba
Arduino
Ibm Midrange
File Upload
Wxpython
Ios7
Wolfram Mathematica
Zsh
Web Applications
Fonts
Unit Testing
Iphone
Codenameone
Sms
Report
Orientdb
Navigation
Ubuntu
Class
Mongodb
Orchardcms
Bootstrap 4
Markdown
Xaml
Sitecore
Css
Stripe Payments
Sublimetext3
Vue.js
Cucumber
Resharper
Groovy
Coding Style
Imagemagick
Ajax
Core Data
Knockout.js
Bluetooth
Database Design
Amazon Redshift
Mule


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网