Python在web抓取中遇到破折号问题_Python - Fatal编程技术网

Python在web抓取中遇到破折号问题

python

Python在web抓取中遇到破折号问题,python,Python,我有一个简单的脚本，它可以从谷歌上搜索一个链接，然后再搜索那个链接。但是，有些链接中包含破折号，出于某种原因，它在我的脚本（url）中显示为这样的%25E2%2580%2593。所以现在看起来是这样的：http://myaddress.com/search?q=The_%25E2%2580%2593_World当我希望它看起来像这样时http://myaddress.com/search?q=The_–世界。我该怎么做呢？我应该使用UTF-8编码/解码吗编辑：我尝试了双重取消引用（参考链接）

我有一个简单的脚本，它可以从谷歌上搜索一个链接，然后再搜索那个链接。但是，有些链接中包含破折号，出于某种原因，它在我的脚本（url）中显示为这样的

%25E2%2580%2593

。所以现在看起来是这样的：

http://myaddress.com/search?q=The_%25E2%2580%2593_World

当我希望它看起来像这样时

http://myaddress.com/search?q=The_–世界

。我该怎么做呢？我应该使用UTF-8编码/解码吗

编辑：

我尝试了双重取消引用（参考链接），但没有成功。相反，我得到的结果如下：

http://myaddress.com/search?q=The_–eu World

URL似乎是双URL编码的
要解码为原始形式，请使用urllib库的parse.unquote函数执行双URL解码：

import urllib.parse url = 'http://myaddress.com/search?q=The_%25E2%2580%2593_World' urllib.parse.unquote(urllib.parse.unquote(url))
解码到所需的http://myaddress.com/search?q=The_–World的URL
编辑：
正如您所解释的，您使用的是Python 2.7，等效的解码函数是
unquote（url）
（请参阅文档）
输出：

http://myaddress.com/search?q=The_–-U World
那篇文章的可能副本没有帮助；我的破折号仍然是“转义”的。我忘了提到我使用的是Python 2.7；我知道
urllib.parse
是Python 3库。我试着改用
urllib.url2pathname
，这确实在第一步显示了有希望的迹象ut反而给了我这个
P:\\myaddress.com\search？q=The€“\u World
（当我对它进行双重解码时）。我想这与不使用UTF-8解码有关？
import urllib url = 'http://myaddress.com/search?q=The_%25E2%2580%2593_World' print(urllib.unquote(urllib.unquote(url))).decode('utf-8')

[google api]相关文章推荐

Google api 使用'时出错；谷歌api网络客户端'；接触易熔电缆 google-api

Google api Google API客户端生成器Python未运行 google-api

Google api 如何从GA API检索合并的大量页面的总视图计数 google-api

Google api 如何对G+；使用python客户端的域API google-api google-plus

Google api 使用普通Google帐户作为服务帐户 google-api

Google api 如何增加谷歌翻译API的配额？ google-api

Google api 为什么我们会得到；gd:已超出extendedProperty计数限制；错误？ google-api

Google api 如何从基于列表的提要url获取Google工作表的web url？ google-api google-sheets

Google api 谷歌预测API的连续调用给出响应'；未定义'； google-api

Google api 无法使用用户。消息：修改google API选项 google-api gmail

Google api 自定义PHP管理中的YouTube API报告 google-api youtube-api

Google api 使用api从google云存储下载文件 google-api google-cloud-storage

Google api Drive API V3-列表搜索服务不支持'；不能使用大写重音 google-api google-drive-api

Google api 谷歌驱动器文件删除错误。用户对此文件没有足够的权限 google-api google-drive-api

Google api Google语音API:在此服务器上找不到请求的URL google-api google-cloud-platform

Google api 自2020年1月起，如何通过Google Drive API在查询中下载非共享文件而不使用access_令牌 google-api google-drive-api

Google api 使用JWT授权GMail API google-api jwt

Google api 如何让我的应用程序访问公共共享的Google驱动器文件 google-api google-drive-api

Google api ggmap商店位置（完整列表） google-api

Google api 将客户转移到您的经销商帐户 google-api

随机文章推荐

Optimization 我应该使用哪种数据结构来存储哈希值？ optimization data-structures

Optimization 这是a&x201C；大型”；GraphViz图表，以及如何修复它？ optimization graphviz

Optimization SSE计划在AMD上比在Intel上花费的时间要长得多 optimization

Optimization 如何在HTTP内容类型响应头中指定字符集？ optimization character-encoding

Optimization Java HashMap：使用字节和引用键的内存优势？ optimization memory memory-management

Optimization 每秒触发器是处理器速度的量度，还是算法速度的量度？ optimization floating-point

Optimization 今天能打败装配工吗？ optimization assembly

Optimization 如何优化嵌套密码查询？ optimization neo4j

Optimization 车把模板预编译优化提示 optimization

Optimization Proc Optmodel条件约束SAS optimization sas

Optimization 汉明距离之和 optimization

Optimization 如何解释CPLEX交互式优化器的输出？ optimization

Optimization 解决；加权活动选择“；OptaPlanner的问题 optimization

Optimization 我可以强制Rust不优化单个函数吗？ optimization rust

Optimization 运行TensorFlow测试时Bazel中的优化标志 optimization tensorflow bazel

Optimization 有或没有幻灯片的主页 optimization responsive-design

Optimization 固定格式源代码中的Fortran是否更易于编译器优化？ optimization fortran

Optimization 条件Fortran循环的优化 optimization fortran

Optimization 矢量化索引识别，加快GPU处理速度 optimization pytorch

Optimization Gekko-最优调度的不可行解，与gurobi的比较 optimization time

[python]相关推荐

如何使用hasattr检查Python中的子模块
Python Import Module

Python程序员的逻辑任务。从列表生成列表的元组
Python List

如何在Python中进行类似Java的类型转换（byte）（Integer.parseInt（bytearrastr[i]，16]）？
Python Python 3.x

Python 如何解码以下字符串
Python

使用python将整型转换/串联为strying
Python File Io

Python：类如何从函数继承？
Python

Python 如果我有第2行的内容，我想得到第9行的内容。如何做？
Python

如何在Python中迭代排序的iterable
Python

Python Django认证问题
Python Django

带嵌套大括号的python解析绑定配置
Python Regex Parsing

Python 如何解决导入错误？
Python Python 2.7 Python 3.x

Python 通过xpath选择，只知道元素的结尾'；s属性
Python Xml Xpath Web Scraping

Python 如何更改一个列表而不更改另一个？
Python

Python：基于行之间的比较选择行
Python Indexing Pandas

Python 火花塞反射镜微调零位元件
Python Apache Spark Pyspark

Python 拆分数据帧的多个/所有列
Python Pandas

Python 在matplotlib图形的tkinter GUI显示中，以x轴绘制音频时间，而不是音频采样率
Python Matplotlib Tkinter

Python TF-IDF和弓技术不兼容吗？
Python Nlp

Python 在另一个字符串中搜索utf-8字符串时出现问题
Python String Text

Python 从超级终端寻找蟒蛇
Python Terminal

Python 使用ctypes导入dll函数
Python Vb6

Python 动态神经网络的性能比较
Python Python 3.x Machine Learning Neural Network

Python 提交时的完整性错误
Python Html Mysql Django

有没有更好的方法在python中生成等轴测地图网格？
Python Dictionary Grid

Python scipy未进行优化并返回“；由于精度损失”；
Python Python 3.x

具有多个id的VIP登录/确认'；s（Python）
Python

Python NLP文本分类ai模型的GCP部署
Python Google Cloud Platform Scikit Learn

Python 如何将文件夹包含在cx\ U冻结中？
Python

Python 第一次使用lmfit minimize来拟合z=f（x，y），它是符文，但系数总是以0结尾
Python Numpy

python-CURL-restapi数据操作
Python Rest

Tags

Oracle10g Elm Rx Java Liferay Twilio Azure Data Factory Apache Maven 2 Eclipse Plugin .net 4.0 Tabs Directory Asp.net Core Cakephp C# Modelica Logging Pandas Google Chrome Timer Lisp Javafx 2 Jira Xcode4 Webview Shell Xpath Quickbooks Push Notification Windows Database Macos Arrays Assembly Haskell Android Studio Codeigniter Rspec Yii2 Uitableview Prestashop Sonarqube Hyperlink Three.js Spotify Login D Atom Editor Domain Driven Design Snmp Html5 Canvas Cluster Computing Mobile Dotnetnuke Windows Phone 8.1 Perl Centos Logstash Maps Arangodb Design Patterns Sdk Twig Jasmine Sharepoint Twitter Bootstrap 3 Vaadin Windows Store Apps Ruby Opencv Sapui5 Coq Xamarin.forms Variables Ipython C Navigation Wso2 Akka Kendo Ui Url Rewriting Amazon Ec2 Openstack Oracle Python Sphinx Subsonic Activerecord Vbscript Webrtc Discord.js Vb.net Mule Sas Class Logic Grep Ruby On Rails 3.2 Windbg Netty Replace Qt Keyboard Machine Learning Polymer Django Rest Framework Wix Notepad++ Outlook Calendar Artificial Intelligence Laravel 5 Coffeescript Matlab Apache Kafka Libgdx Redux Alfresco Paypal Twitter Bootstrap Hibernate Electron If Statement Kentico Math Jestjs Sails.js Apache Camel Gdb Wpf Android Emulator Data Structures Tfs Excel Formatting Java Me Eclipse Rcp Glassfish Jekyll Ios7 Youtube Api Methods Facebook Graph Api Doctrine Orm Amazon Dynamodb Kibana Gruntjs Snowflake Cloud Data Platform Here Api Report Memory Leaks Jvm Workflow Opengl Solr Google Analytics Git Teamcity Cocos2d X Java 8 Open Source Umbraco Service Firebase Azure Regex Mvvm Deep Learning Notifications Visual Studio 2015 Shiny Inno Setup Multithreading Floating Point Authentication Wordpress Tree Server Angular Material Jdbc Types Apache Flink Pip Symfony1 Anaconda Internet Explorer Jwt Spring Boot Redirect Kubernetes Ignite Kdb Command Line Hybris Api Gwt Video Appium Serialization Redis Amazon Cloudformation Google App Maker

Copyright © 2024. All Rights Reserved by - Fatal编程技术网