URL解码与理解

URL解码与理解,url,web-scraping,seo,Url,Web Scraping,Seo,最近我开始学习网络结疤。为此,我需要重点关注URL及其基本结构。我考虑了两个来自Amazon和Priceline的URL用于家庭工作 URL的一些基本概念 查询字符串位于URL的末尾,以单个 问号“?” 参数作为键值对提供,并由 符号“&” 使用等号“=”分隔键和值 大多数web框架都允许我们定义“nice” 查找“仅在URL路径中包含参数的URL” 亚马逊网址 https://www.amazon.com/books-used-books-textbooks/b/?ie=UTF8&node

最近我开始学习网络结疤。为此,我需要重点关注URL及其基本结构。我考虑了两个来自Amazon和Priceline的URL用于家庭工作

URL的一些基本概念

  • 查询字符串位于URL的末尾,以单个 问号“?”
  • 参数作为键值对提供,并由 符号“&”
  • 使用等号“=”分隔键和值
  • 大多数web框架都允许我们定义“nice” 查找“仅在URL路径中包含参数的URL”
亚马逊网址

https://www.amazon.com/books-used-books-textbooks/b/?ie=UTF8&node=283155&ref_=nav_cs_books_788dc1d04dfe44a2b3249e7a7c245230

据我了解:

Parameters
ie=UTF8
node = 283155
ref_=nav_cs_books_788dc1d04dfe44a2b3249e7a7c245230

Key       Values
ie        UTF8
node      283155
ref_      nav_cs_books_788dc1d04dfe44a2b3249e7a7c245230
key    values
from   20210310  2021 - 03 -10
to     20210317  2021 - 03 -17
rooms  1
价格线URL

https://www.priceline.com/relax/in/3000005381/from/20210310/to/20210317/rooms/1?vrid=16e829a6d7ee5b5538fe51bb7e6925e8

此url基于芝加哥2021年10月3日至2021年17月3日的酒店预订

据我了解:

Parameters
ie=UTF8
node = 283155
ref_=nav_cs_books_788dc1d04dfe44a2b3249e7a7c245230

Key       Values
ie        UTF8
node      283155
ref_      nav_cs_books_788dc1d04dfe44a2b3249e7a7c245230
key    values
from   20210310  2021 - 03 -10
to     20210317  2021 - 03 -17
rooms  1

除此之外,我什么也没发现。我只是确定我错过了什么?这些URL可以更精确地分析吗?

可能有帮助的提示有:

可以通过GET或POST发布数据。用URL描述的是GET。POST是指在url中看不到任何内容

在这两种情况下,熟悉使用浏览器的开发人员控制台将帮助您探索网站的工作方式。在Chrome中,您可以点击F12或右键单击任何元素并选择“检查元素”。这在尝试检查使用POST传递的数据时特别有用,因为您在url中看不到这些数据。使用“网络”选项卡,同时单击周围以查看网站在后台执行的操作

最后,只是玩一下网站。例如,当您浏览Amazon时,您可能会注意到url的外观,但如果您使用它,您会注意到您可以删除标题,并且url仍然是这样工作的: