Python 在编码为ascii时丢失引号_Python_Regex_Utf 8_Ascii - Fatal编程技术网

Python 在编码为ascii时丢失引号

python regex utf-8

Python 在编码为ascii时丢失引号,python,regex,utf-8,ascii,Python,Regex,Utf 8,Ascii,我想从新闻文章的引文中摘录这段文字。为此，第一步涉及提取新文章。然后在第二步中，使用正则表达式获取报价。我不确定，但当我编码成ascii码时，引号会丢失。有办法解决这个问题吗 from goose import Goose from requests import get response = get('http://www.nytimes.com/2015/05/19/health/study-finds-dense-breast-tissue-isnt-always-a-high-canc

我想从新闻文章的引文中摘录这段文字。为此，第一步涉及提取新文章。然后在第二步中，使用正则表达式获取报价。我不确定，但当我编码成ascii码时，引号会丢失。有办法解决这个问题吗

from goose import Goose
from requests import get

response = get('http://www.nytimes.com/2015/05/19/health/study-finds-dense-breast-tissue-isnt-always-a-high-cancer-risk.html?src=me&ref=general')
extractor = Goose()
article = extractor.extract(raw_html=response.content)
text = article.cleaned_text
encode_text=text.encode('ascii','ignore')
comments=re.findall('"([^"]*)"', encode_text)
print comments

不要使用暴力破坏一切，而是使用将文本翻译成ASCII

>>> unidecode.unidecode(u'“…”')
'"..."'

请提供一个使用示例。从页面：

>>从unidecode导入unidecode

>unidecode（u'ko\u017eu\u0161\u010dek'）

'kozuscek'
>unidecode（u'30\U0001d5c4\U0001d5c6/\U0001d5c1'）
'30 km/h'
《北京》
@IgnacioVazquez Abrams你为什么不在你的答案中添加一个例子呢。




[regex]相关文章推荐



                                                        
regex how to：如果某个东西在行的开头，那么匹配就开始了，don'；不匹配
regex 
Regex 用于在子字符串中用破折号替换空格的正则表达式。
regexstringreplace 
Regex 搜索源代码时出错，因为单词之间有额外的空格
regexnotepad++ 
Regex 包含小于或等于20的数字的正则表达式
regex 
Regex 记事本++；搜索/替换-\1或$1中的正则表达式反向引用语法
regexnotepad++replace 
Regex 如何获取clojure中正则表达式中的最后一个组
regexclojure 
Regex mod_rewrite忽略特定查询字符串参数
regexapache.htaccessmod-rewrite 
Regex 命令行中的Perl：在一个文件中只替换一次正则表达式
regexperl 
Regex Perl正则表达式不匹配
regexperl 
Regex 为什么这行正则表达式会捕获空白？
regexpython-2.7syntax 
Regex 转义替换字符串'；阅读'；来自用户
regexbashsed 
Regex “我如何找到全部”；姓；在/etc/passwd文件中，5-10个用户共享哪些内容？
regexperl 
Regex 正则表达式匹配区分大小写关闭
regexvb.net 
Regex 更改记事本中每个文件的第一行++；
regexnotepad++ 
Regex 从具有不一致换行符的文本中提取数字
regex 
Regex 正则表达式模式在python中不匹配
regexpython-3.x 
Regex jmeter中的正则表达式提取器-从响应中提取多个值。？
regexjmeter 
Regex Powershell正则表达式以删除文本块
regexpowershell 
Regex 如何让Perl one liner仅显示文件中的第一个正则表达式匹配？
regexperl 
Regex 使用sed命令在UNIX上处理正则表达式/扩展正则表达式
regexunixsed 
                                       





随机文章推荐



                                                        
处理和部署XQuery存储过程的最佳方法？
xquery 
在XQuery中，如何在第二个列表中列出包含一个或多个子元素的文件？
xquery 
如何使用XQuery从一系列值中选择属性的特定值？
xquery 
Xquery 将输出从exist db打印到文件
xquery 
Xquery 在FLWOR中执行函数而不使用“let”
xquerymarklogic 
Xquery MarkLogic三对象语言
xquerymarklogic 
Xquery 如何访问bing搜索api并将结果存储到marklogic server？
xquerymarklogic 
Xquery 如何在MarkLogic中重命名文档？
xquerymarklogic 
Xquery 如何获得marklogic spell:suggest api中数字的拼写建议？
xquerymarklogic 
使用Xquery需要marklogic数据库中的URI列表
xquerymarklogic 
如何在XQuery（exist db）中使用update动态搜索/替换文本
xquery 
XQuery：如何输出字符串文本&；属性价值
xquery 
Xquery cts搜索以测试元素是否不可用
xquerymarklogic 
Xquery 使用where筛选平均值计算不起作用
xquery 
Xquery xdmp:word-convert（）与MarkLogic中的DOCX
xquerymarklogic 
Xquery 扩展的树缓存在marklogic上已满
xquerymarklogic 
Xquery 检索XML子集
xquery 
Xquery arg1不是xs:anyAtomicType类型
xquerymarklogic 
打印以“，”分隔的值；及；在xquery中
xquerymarklogic 
Xquery MarkLogic单时态搜索
xquerymarklogic


                                        

                                        
                                        


                                                
                                                        [python]相关推荐
                                                        
获取Python代码块中myvim.vim文件的绝对路径
									Python
							 									Vim
							 
Python pyqt示例的奇怪结果：图像查看器
									Python
							 									Python 2.7
							 
如何围绕perl程序编写Python包装器？
									Python
							 									Perl
							 
Python For循环调用urllib.urlopen（）.getcode（）的速度很慢
									Python
							 									Performance
							 									Python 2.7
							 									For Loop
							 
此Python代码段的最短ruby等价物
									Python
							 									Ruby
							 									String
							 
Python 如何创建一个具有输出的程序，以便在每个字母向下移动时将其重复一次？
									Python
							 
Python 为什么web2py中两个逻辑相似的查询会给出不同的结果？
									Python
							 
在Python中比较样本平均值与随机分类
									Python
							 									Pandas
							 
Python 切片数组的numpy argmin（）是否返回原始索引？
									Python
							 									Arrays
							 									Numpy
							 
如何在python中解析json嵌套dict？
									Python
							 									Json
							 									Parsing
							 									Dictionary
							 
Python numpy布尔索引多个条件
									Python
							 									Numpy
							 
Python 如何使用BitBucket管道上的Docker测试需要PostGIS的Django应用程序？
									Python
							 									Django
							 									Docker
							 
Python 如何将MATLAB集成到TensorFlow？
									Python
							 									Matlab
							 									Tensorflow
							 
Python2.7列表理解数字金字塔
									Python
							 									Python 2.7
							 
Python 如何找到第一个<；td>；在包含<；p>；元素使用BeautifulSoup？
									Python
							 									Html
							 									Parsing
							 									Web Scraping
							 
在Python中移动一行
									Python
							 
在python中的新文件中粘贴文件
									Python
							 									File
							 
Python POST请求，无需重新加载页面
									Python
							 									Post
							 
如何在python中查找另一个字符串（句子）中一个字符串（可以是多个单词）的计数/出现次数
									Python
							 									String
							 									Algorithm
							 
Python Django在重定向时找不到模式名
									Python
							 									Django
							 									Django Models
							 
基于SSL的Python REST API
									Python
							 									Rest
							 									Django Rest Framework
							 
Python 使用带有xpath的lxml findall（）查找多种类型的标记？
									Python
							 									Xml
							 
Can'；t运行包含两个函数的Python脚本
									Python
							 
Python 如何将颜色条放入matplotlib图例中
									Python
							 									Matplotlib
							 
Python 如何从（'；a'；、'；a/b'；、'；a/b/c'；）中获取（'；a'；、'；b'；、'；c'）？
									Python
							 
Python Django/引导错误：参数"；表格「；应包含有效的Django表单
									Python
							 									Django
							 									Bootstrap 4
							 
Python 两个分数之间的相关性，其中一个分数具有置信区间
									Python
							 
Python 未经授权的客户端：授权类型'；授权代码'；不允许用于客户端。Django-auth0-login
									Python
							 									Django
							 
Python 使用Plotly中的三个1D浮动阵列创建三维曲面打印
									Python
							 									Matplotlib
							 
Python 如何在Sagemaker中获取特定模型映像的Amazon ECR容器URI？
									Python
							 									Amazon Web Services
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Here Api
For Loop
Socket.io
Jar
Exception
Netsuite
Networking
Symfony1
C++
Forms
Eclipse Plugin
Linker
Dynamics Crm 2011
Bootstrap 4
Gstreamer
Aframe
Asp.net Mvc 2
Iis
Io
Vb.net
Monitoring
Binding
Excel
Ios6
Stata
Drools
Dynamics Crm
Discord.js
Sockets
Service
Operating System
Scroll
Encoding
Artifactory
Grep
Printing
Nuget
Scikit Learn
R
Glsl
Chart.js
Security
Openssl
Db2
Opengl Es
Talend
Polymer
Redux
Rxjs
Pagination
Uml
Dependency Injection
Xquery
Microservices
.htaccess
Plone
Ada
Fonts
Logic
Java Me
Google Plus
Google Colaboratory
Magento2
Nest
Woocommerce
Spring Boot
Network Programming
Elm
Stored Procedures
Opencl
Ajax
Sails.js
If Statement
Parse Platform
Hbase
Elixir
Vaadin
Servlets
Tomcat
Pandas
Uwp
Latex
Raspberry Pi
Asp.net Web Api
Binary
Gridview
Linkedin
Automation
Scheme
Tree
Windows Phone 7
Clang
Biztalk
Neo4j
Xamarin.android
Asp.net Mvc 3
Oracle11g
Oauth 2.0
Post
Jenkins
Camera
Mips
Mongodb
Gcc
Core Data
Ms Office
Postman
Compiler Construction
View
Knockout.js
Vue.js
Unicode
Deep Learning
Isabelle
Firefox Addon
Cucumber
Fortran
Single Sign On
Air
Z3
Javascript
Grafana
Gremlin
Embedded
Dependencies
Vector
Vagrant
Apache Zookeeper
Cobol
Nsis
Floating Point
Asp.net Core
Google App Engine
Inheritance
Jasmine
C# 4.0
Workflow
Entity Framework
Installation
Python 2.7
Typo3
Map
Log4j
Umbraco
Websphere
Linq
Documentation
Graphics
Wix
Hybris
Macos
Acumatica
Modelica
Jquery
Android Emulator
Websocket
Openstack
Mod Rewrite
Sapui5
Sharepoint 2007
Opengl
Kotlin
Composer Php
Sonarqube
Configuration
Cookies
Wxpython
Asp.net Mvc 4
Office365
Oracle
Vb6
Session
Sequelize.js
Amazon Redshift
Debian
Ecmascript 6
Snmp
Twitter Bootstrap
Ubuntu
Hyperledger Fabric
Sqlite
Spring Batch
Windows
Gatsby
Cloud
Sql Server 2008 R2
Spring Security
Migration
Javafx 2
Text
Snowflake Cloud Data Platform
Command Line
Firebase
Wolfram Mathematica
Types
Magento
Scrapy
Sms
Google Cloud Platform
Hadoop
Visual Studio 2015


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网