Python 使用BeautifulSoup处理HTML中的非AscII字符_Python_Python 2.7_Beautifulsoup - Fatal编程技术网

Python 使用BeautifulSoup处理HTML中的非AscII字符

python python-2.7

Python 使用BeautifulSoup处理HTML中的非AscII字符,python,python-2.7,beautifulsoup,Python,Python 2.7,Beautifulsoup,我从一个网站上提取数据，当查看源代码时使用，但当使用beautiful soup提取数据时，python解释器中显示为Tá。我正试图针对td中的数据。现在它是空的。像下面这样的东西不起作用，因为这不是Ascii字符。救命啊 result = <td class="xxx"> </td> #Check to see if it is returning an empty string if not result: print 'empty' 结

我从一个网站上提取数据，当查看源代码时使用

，但当使用beautiful soup提取数据时，python解释器中显示为

Tá

。我正试图针对td中的数据。现在它是空的。像下面这样的东西不起作用，因为这不是Ascii字符。救命啊

result = <td class="xxx">&nbsp;</td>

#Check to see if it is returning an empty string
if not result:
    print 'empty'

结果=
#检查是否返回空字符串
如果没有结果：
打印“空”

我一直在使用该软件包来帮助我解码上游客户端传递给我的unicode。它似乎在我当前的所有测试用例中都有效。基本上，它采用unicode并试图将其转换为ASCII等价物。

无论是“Tá”还是“”（或带有文本nbsp的字符串）都不会是空字符串。此外，BeautifulSoup不会将“tá”转换为“tá”……您能给我们展示更多的来源吗？HTML的URL？当然可以。这是URL-这是TD中的数据：“”该注释中冒号后是否应该有URL？好了。：-）该源代码中大约有10亿个

s：如何缩小HTML的范围？（您如何计算

结果？）如果您可以发布一个显示您的问题的最小测试用例，它将允许我们运行/调试它。是的，




[python 2.7]相关文章推荐



                                                        
Python 2.7 Python：如何将两位数的字符串拆分为一个数组
python-2.7 
Python 2.7 Python错误：“TypeError:'int'对象没有属性'\uu getitem''
python-2.7 
Python 2.7 Python中的服务器：无需重定向即可在URL上写入或添加参数
python-2.7 
Python 2.7 叠加在笛卡尔图上的极坐标图中元素的matplotlib zorder
python-2.7matplotlib 
Python 2.7 Python线程-停止其他线程
我从一个自定义工具触发一个事件，我有4个linux服务器，在那里我需要监控日志和特定事件ID的grep
事件ID可能出现在4台服务器中的任何一台中
我编写了一个方法，可以对grep模式进行ssh会话检查。因为可能会添加许多服务器，所以我使用线程模块在指定的时间内并发地查看所有服务器
如果在一个服务器中找到匹配，我希望其他线程停止。如果在一个线程中发现了模式，有没有办法通知其他线程停止搜索？安全吗
python-2.7 
Python 2.7 我可以从空闲运行脚本，但不能从python.exe运行脚本？
python-2.7 
Python 2.7 Inno安装编译器后init.tcl出现Python错误
python-2.7installationtclinno-setup 
Python 2.7 TypeError:应为字符缓冲区对象（尝试写入文本文件）
python-2.7 
Python 2.7 在python中运行有状态RPC服务器
python-2.7 
Python 2.7 从远程vm使用python和pika在RabbitMQ上握手超时
python-2.7rabbitmq 
Python 2.7 二维结构阵列
python-2.7numpy 
Python 2.7 ODOO8中的方法读取声明
python-2.7odoo 
Python 2.7 谷歌硬盘文件下载中重复的空行
python-2.7google-drive-api 
Python 2.7 在混乱矩阵中获取列表索引超出范围错误
python-2.7 
Python 2.7 如何在AWS lambda中获取亚马逊帐户电子邮件信息
python-2.7aws-lambda 
Python 2.7 在编写XML文件时读取它（在Python中）
python-2.7python-3.xstream 
Python 2.7 如何使用YoctoLinux映像将python kivy支持添加到我的arm板引导中
python-2.7yocto 
Python 2.7 如何在aws定价boto3 api get产品中使用页面迭代器
python-2.7amazon-web-servicespagination 
Python 2.7 当文本输入集中在Kivy Python上时，如何显示虚拟键盘
python-2.7 
Python 2.7 _尝试通过Python 2.7和ctds连接Azure数据仓库时出现tds.InterfaceError
python-2.7kubernetesazure-sql-database 
                                       





随机文章推荐



                                                        
Mvvm 初始化视图模型
mvvmsilverlight-4.0 
MVVM程序复杂性的代码度量KPI
mvvm 
Mvvm DataGrid上的动态转换器参数
mvvm 
Mvvm Durandal-使用相同VM/View的多个路由
mvvm 
根据MVVM：服务是模型组件还是视图模型的一部分？
mvvm 
如何使用MVVM模式更新UWP pivot外观
mvvmuwp


                                        

                                        
                                        


                                                
                                                        [python]相关推荐
                                                        
Python 使用plt.draw（）时，接收到的串行数据异常
									Python
							 									Matplotlib
							 									Serial Port
							 
无法在Mac上安装Python软件包（gcc-4.0错误）
									Python
							 									Macos
							 									Gcc
							 									Compiler Construction
							 									Terminal
							 
Python Scrapy在下载后将动画gif更改为静态gif
									Python
							 									Scrapy
							 
Python 如果设置库设置失败，是否有方法中止测试？
									Python
							 									Robotframework
							 
Python xlwt-访问现有单元格内容，自动调整列宽
									Python
							 
Python 如何在django rq队列中将非必需的内置对象作为参数传递
									Python
							 									Django
							 
在Python中的多行和单行（带转义换行符）字符串表示之间转换？
									Python
							 									String
							 
Python如何连接跨平台路径
									Python
							 									Path
							 
Python将列值用作字典的数据帧
									Python
							 									Pandas
							 									Dataframe
							 
Python 导入后更改的导入变量
									Python
							 									Python 2.7
							 
Python WTF表格动态生成
									Python
							 
Python PySpark—找到的pivot所需的聚合表达式'；蟒蛇'；
									Python
							 									Dataframe
							 									Apache Spark
							 									Pyspark
							 
Python 如何在MongoDB中将存储为字符串/日期时间（两者）的日期转换为仅日期时间？
									Python
							 									Mongodb
							 									Datetime
							 									Nosql
							 
Python累积回报groupby
									Python
							 									Pandas
							 
在根用户启动的python程序中以非根用户身份调用os.system
									Python
							 									Linux
							 
Python 我试图让屏幕管理器打开不同的屏幕首先取决于一个可变的时间克维
									Python
							 									Python 3.x
							 
Python 如何在第一个连字符之前打印字符？
									Python
							 									Python 3.x
							 
从sqlite3附加表的Python循环列表
									Python
							 									Sqlite
							 									For Loop
							 
Python 如何更改数据帧以计算变量
									Python
							 									Pandas
							 									Dataframe
							 
Python&；Matplotlib：将x轴置于中心，但x轴不跟随勾号和标签
									Python
							 									Matplotlib
							 
Python 如何从大型数据集中删除NaN
									Python
							 									Pandas
							 
Python 尝试使用二维数据设置列
									Python
							 									Pandas
							 									Numpy
							 
Python 删除自动生成的时间戳文件夹并保留内容
									Python
							 									Bash
							 									Shell
							 									Ubuntu
							 
Python 如何将cross_val_分数应用于我们自己的模型
									Python
							 									Tensorflow
							 									Machine Learning
							 									Scikit Learn
							 
Python 如何使用JiTCDDE获得平滑阵列
									Python
							 
在python中对嵌套列表数据进行排序
									Python
							 									List
							 									Sorting
							 
如何在Python中使用range（）函数和bool检查字符串是否包含特定字符？
									Python
							 									String
							 									For Loop
							 
Python boto3（AWS EC2）列出嵌套的JSON数据
									Python
							 									Amazon Web Services
							 
Python 如何将Flask服务器上创建的PIL映像下载到我的桌面。Image.save（）仅将其保存到服务器。无法通过URL访问图像
									Python
							 									Image
							 									Flask
							 
Python SimPy中的Sink状态
									Python
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Windows Phone 8.1
Mips
Jquery
Automation
Swagger
Oracle Apex
Web
Android Studio
Appium
Input
Aframe
Visual Studio Code
Routing
Google Chrome
Xamarin.android
Cocos2d Iphone
Sails.js
Database Design
Grails
Report
String
Sharepoint 2013
Azure Devops
Qt4
Maven
Rspec
Cmake
Playframework
Office Js
Subsonic
Zend Framework2
Filter
Atom Editor
Clojure
Jdbc
Acumatica
Plone
Ssas
Vim
Kibana
Wicket
EmptyTag
Entity Framework 4
Asp.net Core Mvc
Windbg
Linux Kernel
Fonts
Wcf
Wso2
Amazon S3
Composer Php
Sharepoint 2010
Sequelize.js
F#
Symfony1
Gremlin
Crystal Reports
Tinymce
Mercurial
Jakarta Ee
Telegram
Axapta
Domain Driven Design
Azure Active Directory
Computer Science
Fullcalendar
Npm
Hyperlink
Google App Engine
Svg
Hash
Cron
Vb6
Sql
Xpath
Facebook Graph Api
Navigation
Hybris
Sed
Liferay
Ssl
Cocoa Touch
Jsp
Visual C++
Weblogic
Nosql
Z3
Angular6
Jquery Mobile
Doxygen
Opencv
Openerp
Arduino
Ruby On Rails 3.2
Msbuild
Ionic2
Coldfusion
Codenameone
Tsql
Command Line
Bluetooth
Windows 10
Browser
Servlets
Haskell
Ldap
Embedded
Google App Maker
Memory Leaks
Module
Visual Studio 2012
Xsd
Hazelcast
Apache
Path
Struct
Microservices
Primefaces
Programming Languages
Orm
Templates
Stripe Payments
Uwp
Twitter Bootstrap 3
Windows 8
Less
Compiler Errors
Prometheus
Gulp
Events
Computer Vision
Passwords
Batch File
Drop Down Menu
Omnet++
Proxy
Shopify
Spring Batch
C# 4.0
Vb.net
Eclipse Plugin
Dynamics Crm 2011
Google Cloud Dataflow
Stored Procedures
Gtk
Parsing
Network Programming
Installation
Menu
Artificial Intelligence
View
Heroku
Editor
Netlogo
Apache Nifi
Common Lisp
Lotus Notes
Marklogic
Autodesk Forge
Caching
Nuget
Google Cloud Platform
Operating System
Logic
Matrix
Jpa
Xpages
Scikit Learn
Asterisk
Kernel
Ajax
Collections
Nservicebus
Outlook
Orientdb
Jetty
Twitter Bootstrap
Iis 7
Linq To Sql
Breeze
Dialogflow Es
.net 4.0
Antlr4
Parameters
Visual Studio 2008
Plot
Uml
Modelica
C++
.net Core
Glsl
Scheme
Core Data
Xcode4
Drupal
Ffmpeg
D3.js
Jms
Wolfram Mathematica
Web Crawler
Android Fragments


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网