URL解码与理解
最近我开始学习网络结疤。为此,我需要重点关注URL及其基本结构。我考虑了两个来自Amazon和Priceline的URL用于家庭工作 URL的一些基本概念URL解码与理解,url,web-scraping,seo,Url,Web Scraping,Seo,最近我开始学习网络结疤。为此,我需要重点关注URL及其基本结构。我考虑了两个来自Amazon和Priceline的URL用于家庭工作 URL的一些基本概念 查询字符串位于URL的末尾,以单个 问号“?” 参数作为键值对提供,并由 符号“&” 使用等号“=”分隔键和值 大多数web框架都允许我们定义“nice” 查找“仅在URL路径中包含参数的URL” 亚马逊网址 https://www.amazon.com/books-used-books-textbooks/b/?ie=UTF8&node
- 查询字符串位于URL的末尾,以单个 问号“?”
- 参数作为键值对提供,并由 符号“&”
- 使用等号“=”分隔键和值
- 大多数web框架都允许我们定义“nice” 查找“仅在URL路径中包含参数的URL”
https://www.amazon.com/books-used-books-textbooks/b/?ie=UTF8&node=283155&ref_=nav_cs_books_788dc1d04dfe44a2b3249e7a7c245230
据我了解:
Parameters
ie=UTF8
node = 283155
ref_=nav_cs_books_788dc1d04dfe44a2b3249e7a7c245230
Key Values
ie UTF8
node 283155
ref_ nav_cs_books_788dc1d04dfe44a2b3249e7a7c245230
key values
from 20210310 2021 - 03 -10
to 20210317 2021 - 03 -17
rooms 1
价格线URL
https://www.priceline.com/relax/in/3000005381/from/20210310/to/20210317/rooms/1?vrid=16e829a6d7ee5b5538fe51bb7e6925e8
此url基于芝加哥2021年10月3日至2021年17月3日的酒店预订
据我了解:
Parameters
ie=UTF8
node = 283155
ref_=nav_cs_books_788dc1d04dfe44a2b3249e7a7c245230
Key Values
ie UTF8
node 283155
ref_ nav_cs_books_788dc1d04dfe44a2b3249e7a7c245230
key values
from 20210310 2021 - 03 -10
to 20210317 2021 - 03 -17
rooms 1
除此之外,我什么也没发现。我只是确定我错过了什么?这些URL可以更精确地分析吗?可能有帮助的提示有: 可以通过GET或POST发布数据。用URL描述的是GET。POST是指在url中看不到任何内容 在这两种情况下,熟悉使用浏览器的开发人员控制台将帮助您探索网站的工作方式。在Chrome中,您可以点击F12或右键单击任何元素并选择“检查元素”。这在尝试检查使用POST传递的数据时特别有用,因为您在url中看不到这些数据。使用“网络”选项卡,同时单击周围以查看网站在后台执行的操作 最后,只是玩一下网站。例如,当您浏览Amazon时,您可能会注意到url的外观,但如果您使用它,您会注意到您可以删除标题,并且url仍然是这样工作的: