Python 清理Flipkart.com的所有手机_Python_Web Scraping_Beautifulsoup - Fatal编程技术网

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/331.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 清理Flipkart.com的所有手机_Python_Web Scraping_Beautifulsoup - Fatal编程技术网

Python 清理Flipkart.com的所有手机

python web-scraping

Python 清理Flipkart.com的所有手机,python,web-scraping,beautifulsoup,Python,Web Scraping,Beautifulsoup,我正试图从www.flipkart.com上搜刮所有手机。现在，我想做的是，我可以从这里刮走所有的手机 http://www.flipkart.com/mobiles/pr?p[]=sort%3Dprice_asc&sid=tyy%2C4io&layout=grid 现在的问题是，在这个网站上，我必须按“显示更多结果”才能看到更多结果。但是，如何使用代码来实现这一点？我正在使用python中的BeautifulSoup包我的代码到现在为止： import bs4 impor

我正试图从www.flipkart.com上搜刮所有手机。现在，我想做的是，我可以从这里刮走所有的手机

http://www.flipkart.com/mobiles/pr?p[]=sort%3Dprice_asc&sid=tyy%2C4io&layout=grid

现在的问题是，在这个网站上，我必须按“显示更多结果”才能看到更多结果。但是，如何使用代码来实现这一点？我正在使用python中的BeautifulSoup包
我的代码到现在为止：

import bs4 import re import urllib2 import sys link = 'http://www.flipkart.com/mobiles/pr?p[]=sort%3Dprice_asc&sid=tyy%2C4io&layout=grid' response = urllib2.urlopen(link) thePage = response.read() soup = bs4.BeautifulSoup(thePage) allMobiles = soup.find('div', attrs={'id': 'products'})

我只得到输出的第一页？如何访问其他页面？
您可以使用get参数。常规URL为：
http://www.flipkart.com/mobiles/pr?p[]=排序%3Dprice\u asc&sid=tyy%2C4io&layout=grid
点击“更多结果”按钮（或向下滚动）后，下一页将使用AJAX加载，url如下：

url由以下部分组成：

路径：

查询字符串：

p[]：排序=价格

sid：tyy，4io

布局：网格

开始：41

ajax：true

如果您想要所有手机，只需增加“开始”参数。大概是这样的：

item_count = 600 for i in range(0, item_count, 40): link = "http://www.flipkart.com/mobiles/pr?p%5B%5D=sort%3Dprice_asc&sid=tyy%2C4io&layout=grid&ajax=true&start=%d" % (i+1) // Do something with the link print link
享受，不会

[web scraping]相关文章推荐

Web scraping 爬行维基百科 web-scraping web-crawler

Web scraping SAS网络抓取 web-scraping sas

Web scraping 刮痧汤和靓汤有什么区别 web-scraping

Web scraping 我如何从一个网站（可能包括通过RSS阅读器）上抓取所有文章？ web-scraping

Web scraping 如何从样式化的谷歌地图中提取标记（www.oilsandsmagazine.com） web-scraping

Web scraping 使用python脚本抓取NASA网站时出现OSError Err 22[无效参数] web-scraping

Web scraping ImportHTML的Google电子表格中的分析错误 web-scraping google-sheets

Web scraping 使用Selenium和Chromedriver使用python进行Web抓取 web-scraping

Web scraping 如何使用Puppeter获得实际页面加载时间（重新加载后）？ web-scraping google-chrome-devtools

Web scraping 从scrapy shell获取https响应 web-scraping scrapy

Web scraping 美化组，将数据附加到列中，而不是一个字符串 web-scraping

Web scraping 如何从bs4中的标记数组中获取字符串？ web-scraping

随机文章推荐

Iis 7 如何使用APPCMD更改IIS7中网站的物理路径？ iis-7

Iis 7 IIS7应用程序请求路由（arr反向代理）结合受管模块-超时 iis-7

Iis 7 在IIS7上运行但不包含文件的ASP页面 iis-7 asp-classic

Iis 7 approot和sitesroot在Azure中 iis-7 azure

Iis 7 为不同的服务器配置一个web.config文件 iis-7

Iis 7 未能在Windows Vista Home Premium上重新安装IIS7 iis-7 installation

Iis 7 配置部分'；证券技术配置'；无法读取，因为它缺少节声明 iis-7

Iis 7 URL重写以删除文件扩展名会导致页面永远无法完全加载 iis-7 coldfusion url-rewriting

Iis 7 可以使用网络上的IP地址访问网站，但不使用主机名 iis-7 dns

Iis 7 在Windows 2008R2上的IIS 7中自动禁用应用程序池 iis-7

[python]相关推荐

Tags

Syntax Jsf 2 Android Fragments Angularjs Tabs Sublimetext3 Asp.net Mvc 3 Tree Passwords Menu Printing Https Socket.io Azure Ad B2c 3d Nsis Maven 2 Api Cluster Computing Odoo D Tomcat Plot Scroll Active Directory Acumatica Ip Chart.js List Antlr4 Random Sublimetext2 Prestashop Umbraco Odata Couchdb Typescript Graphql Sparql Cypress Boost Opencv R Plsql Filter Winforms Yii2 Memory Leaks Ms Office Web Scraping Apache Zookeeper Spring Integration Asp.net Core Mvc Keyboard Templates Knockout.js Migration .net Navigation Fluent Nhibernate Gruntjs Windows Runtime Ada Typo3 Recursion Ssl Rest Hadoop .htaccess Xna Amazon Web Services Laravel 5 Laravel Asp.net Core Certificate Kotlin System Verilog Redux Numpy Debugging Neo4j Uiview Spring Boot Dataframe Wpf Nosql Function Object Actionscript Instagram Google Cloud Firestore Plugins Xcode Scala Gnuplot Firefox C++ Cli Ecmascript 6 Geolocation Documentation Google App Maker Silverstripe Vue.js Lua Aws Lambda Google Api Operating System Inno Setup Cloud Foundry Timer Kernel Ruby On Rails Directory Raspberry Pi Java Me Utf 8 Canvas Asp.net Mvc Wcf Jmeter Rss Kdb Crystal Reports Gcc Telegram Floating Point Arm Docker Sms Common Lisp Mpi Cryptography Cocos2d Iphone Vbscript Design Patterns Ssas Clang Drop Down Menu Heroku Generics Vhdl Modelica Requirejs Ruby Google Cloud Dataflow Frameworks Jwt Meteor Sip Graphics Sails.js Jar Flutter Microservices Usb Spring Security Junit Single Sign On Azure Cosmosdb Apache Camel Tags Abap Events Text Twitter Performance Authentication Binary Sql Server Tcl Jdbc Ms Word Internet Explorer Salesforce Apache Spark Angular Sharepoint 2007 Sap Vim Robotframework Keycloak Apache Nifi Oauth Debian Zend Framework Dojo Notifications Select Apache2 Compression Django Rest Framework Web Crawler Docusignapi Twitter Bootstrap 3 Workflow Jquery Plugins Download Linux Kernel Web Services Charts Deployment

Copyright © 2024. All Rights Reserved by - Fatal编程技术网