Python Instagram Web刮刀故障_Python_Web Scraping - Fatal编程技术网

Python Instagram Web刮刀故障

python web-scraping

Python Instagram Web刮刀故障,python,web-scraping,Python,Web Scraping,我正在尝试构建一个web scraper，告诉我一个标签在Instagram上使用的次数，但我在不同的迭代中不断得到错误代码，或者当前响应为“无”。这是我的代码和html Python import requests from bs4 import BeautifulSoup url = 'https://www.instagram.com/explore/tags/savethekids/' page = requests.get(url) soup = BeautifulSoup(page

我正在尝试构建一个web scraper，告诉我一个标签在Instagram上使用的次数，但我在不同的迭代中不断得到错误代码，或者当前响应为“无”。这是我的代码和html

Python

import requests
from bs4 import BeautifulSoup
url = 'https://www.instagram.com/explore/tags/savethekids/'
page = requests.get(url)
soup = BeautifulSoup(page.content, 'html.parser')
tag = soup.find("span", {"class": "g47SY "})
print(tag)

这就是我写的代码

HTML

<span class="-nal3 ">
  <span class="g47SY ">22,922</span> 
   " posts"
</span>


22,922 
“职位”

这是Instagram中的HTML

如果任何真正知道自己在做什么的人都能指出我做错了什么以及如何修复它，那就太好了。

使用请求时的问题是html还没有呈现出来。尝试在instagram上进行以下操作

它使用一个名为selenium的工具从instagram获取实际的html

当selniumwebdriver工作时，下面的代码应该得到您正在寻找的元素

from selenium.webdriver import Chrome
browser = Chrome()
url = 'https://www.instagram.com/explore/tags/savethekids/'
browser.get(url)
print(browser.find_element_by_class_name('g47SY'))

试试这个

导入请求
url='1〕https://www.instagram.com/explore/tags/savethekids/?__a=1'
response=requests.get（url）
count=response.json（）.get（'graphql'，{}）.get（'hashtag'，{}）.get（'edge\u hashtag\u to\u media'，{}）.get（'count'）
打印（计数）

输出：

查看它的实际操作

是否需要刮网？因为如果不是，您可以使用获取媒体的

标题，然后解析hashtags。它不在实际的页面源中。
22924




[web scraping]相关文章推荐



                                                        
Web scraping NameError:使用Scrapy时未定义名称“hxs”
web-scrapingscrapy 
Web scraping 打印不带HTML标记的表以用于计算
web-scraping 
Web scraping 如何使和服实验室不跳过空白表格单元格？
web-scraping 
Web scraping 用rvest刮网。以NA的身份返回
web-scraping 
Web scraping 已爬网0页，但没有可见问题？
web-scrapingscrapy 
Web scraping 如何将web元素传递到BeautifulGroup
web-scraping 
Web scraping 我如何把两个聪明的演员连在一起？
web-scraping 
Web scraping 基于页面内容的操作
web-scrapingscrapyweb-crawler 
Web scraping 如何使用木偶师在div内滚动？
等待页面。评估（（）=>{
if（document.querySelector（'div.U1vjCc'）！=null）
{
对于（var i=0；i可能重复：这是否回答了您的问题？
await page.evaluate(
web-scraping 
Web scraping 在网站上使用jsoup刮取脚本标记中的文本
web-scraping 
Web scraping 如何在没有403错误的情况下进行avito.ru的刮片
web-scraping 
Web scraping 集国家而刮亚马逊
web-scrapingscrapy 
Web scraping 错误：使用Puppeter进行Webscraping-无法读取属性'；getProperty'；未定义的
web-scraping 
Web scraping Web抓取图像并将其加载到Google云存储中
web-scrapinggoogle-cloud-platformgoogle-cloud-storage 
                                       





随机文章推荐



                                                        
Jakarta ee ApacheGeronimo的jndi默认上下文中的java.lang.String-如何？
jakarta-ee 
Jakarta ee WebSphere自定义访问日志
jakarta-eeloggingwebsphere 
Jakarta ee 在验证方法STRUTS中使用请求对象
jakarta-eeservlets 
Jakarta ee 注入JMS@Resource时Glassfish中的空指针
jakarta-eeglassfishjms 
Jakarta ee EJB3.1 |通过JNDI调用远程会话bean时出错
jakarta-eeglassfish 
Jakarta ee Do@Service JBoss EJB'；s支持事务？
jakarta-eejboss 
Jakarta ee 此程序正在TCP套接字上侦听–；哪个？（&；如何查明它是否没有这样说？）
jakarta-eetcpcmd 
Jakarta ee 使用web界面监视solr的服务器日志
jakarta-eeloggingsolrweb 
Jakarta ee android设备上的JSF流式下载返回.htm文件
jakarta-eejsf-2downloadandroid 
Jakarta ee 无法远程调用方法
jakarta-eeglassfish 
Jakarta ee JavaEE应用服务器如何管理LIB？
jakarta-ee 
Jakarta ee 设计相同性质的相关实体（即：相关文章）的最佳方式是什么？
jakarta-eejpa 
Jakarta ee 将en-EJB注入viewscope Bean是否有害？
jakarta-eejsf-2 
Jakarta ee 接受者不'；不能在消息驱动Bean中工作
jakarta-ee 
Jakarta ee 如何在大型javaee项目中处理计时器服务？
jakarta-ee 
Jakarta ee 在Glassfish上部署时发生数据库连接错误
jakarta-eenetbeansglassfish 
Jakarta ee LTPA令牌过期时，WebSphere 8.5.5上带有vaadin web应用程序的UnauthorizedSessionRequestException
jakarta-eewebspherevaadin 
Jakarta ee 有没有办法在@ManagedBean@ViewScoped中使用@Asynchronous方法？
jakarta-eeasynchronous 
Jakarta ee 如何防止proxy-config.xml进入Websphere中的AjaxProxy应用程序
jakarta-ee 
Jakarta ee 在运行时JavaEE7中设置数据源
jakarta-ee


                                        

                                        
                                        


                                                
                                                        [python]相关推荐
                                                        
Python 如何使subprocess.call（）具有多个标准输出？
									Python
							 
锁定python中除一个线程外的所有线程
									Python
							 									Multithreading
							 
Python 如何获得列表的中位数？
									Python
							 
Python 绘制水平轴以进行尺寸比较
									Python
							 									Matplotlib
							 									Plot
							 
Python 更新数据库，如何检查它写的数据
									Python
							 									Mongodb
							 
Python 如何让代码打印一个对象而不是三个？
									Python
							 
Python 试图写一个文件，为什么我得到；str对象不可调用"；？
									Python
							 
Python 检查一组元组是否包含来自另一组的项
									Python
							 									Python 3.x
							 
如何在wxPython中自动调整*wx.CheckListBox*的大小？
									Python
							 									Wxpython
							 
Python 二进制搜索以搜索列表
									Python
							 									List
							 									Python 3.x
							 
Python 如何获取DateTimeIndexed系列中发生在天数列表中的所有条目？
									Python
							 									Pandas
							 
发送ctrl+；使用python将q转换为excel文件
									Python
							 									Excel
							 									File
							 									Com
							 
Mysql准备的语句不会被python中的值替换
									Python
							 									Python 3.x
							 									Sqlite
							 
Python是否内置了特殊字符和/或标点符号的字符串验证？
									Python
							 									String
							 									Python 3.x
							 									Validation
							 
在python中将dict的字符串列表从csv转换为JSON对象
									Python
							 									Json
							 									Csv
							 
在python中将查询结果附加到Excel中的不同工作表
									Python
							 									Excel
							 									Pandas
							 
Python 熊猫系列或列表索引
									Python
							 									Pandas
							 
Python 带有tensorflow cuda版本安装的特斯拉c2075
									Python
							 									Tensorflow
							 									Cuda
							 
Python valueError:以10为基数的int（）的文本无效：''；迁移时
									Python
							 									Django
							 									Python 3.x
							 									Django Models
							 
Python 使用SKKNN显示最近的邻居
									Python
							 									Machine Learning
							 									Scikit Learn
							 
有没有一种方法可以通过在python中忽略列名来读取SQL查询？
									Python
							 									Python 3.x
							 									Pandas
							 
Python 超快速比较两个字符串是否相等的方法
									Python
							 
Python （Django）我如何制作'；objects.get（）'；使用存在的参数？
									Python
							 									Django
							 									Authentication
							 
python中的NaiveBayes Classifier从头开始？
									Python
							 									Machine Learning
							 
Python：如何连接蓝牙设备？（Linux）
									Python
							 									Linux
							 									Bluetooth
							 
Python：从seaborn kdeplot获取半高宽
									Python
							 
Python UTF8编码2.7.5/3.8.5
									Python
							 									Python 3.x
							 									Python 2.7
							 									Utf 8
							 									Character Encoding
							 
Python 在一个非常简单的示例中，线程锁定失败
									Python
							 									Python 3.x
							 
Python 如何使用OpenCV通过直方图信息检测交通灯颜色？
									Python
							 									Opencv
							 									Matplotlib
							 
Python 在子目录中运行脚本时，从上一级目录导入模块
									Python
							 									Python 3.x
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Junit
Editor
Configuration
Streaming
Shopify
Localization
Ios7
Keras
Pandas
Here Api
Biztalk
Prometheus
Sms
Snowflake Cloud Data Platform
Xml
Vbscript
Content Management System
Less
Hibernate
Sencha Touch
Swift
Dojo
Odata
Twitter
Parallel Processing
Sprite Kit
Data Binding
Interface
Artifactory
Elm
Drupal
Keyboard
Cmd
Abap
Unicode
Responsive Design
Flutter
Smtp
Design Patterns
Jvm
Linq To Sql
Nhibernate
Jetty
Java Me
Serial Port
Eclipse Plugin
Robotframework
Date
.htaccess
Graph
Selenium
Db2
Pascal
Algorithm
Dll
Matplotlib
Xpath
Ruby On Rails 4
Blackberry
Spring Boot
Compilation
Dependency Injection
Machine Learning
Clojure
Graphql
Powershell
Project Management
Next.js
Download
Gradle
Prolog
Teradata
Web Crawler
Stanford Nlp
Moodle
Continuous Integration
Ravendb
Titanium
Spring
Jsf 2
Coding Style
Grafana
Bluetooth
Dotnetnuke
Angular
Formatting
Events
Twilio
Knockout.js
Tabs
Sql Server 2012
X86
Model
R
Class
Ldap
Tfs
Pip
Reporting Services
Rss
Jhipster
Firefox Addon
Generics
Grails
Canvas
Jupyter Notebook
Winforms
Teamcity
Automated Tests
Dictionary
Xpages
Meteor
.net
Oracle10g
Visual Studio 2015
Asp.net Mvc
Twitter Bootstrap 3
Snmp
Javafx
Google Chrome Devtools
Breeze
Jar
Activemq
Search
Websocket
Ruby On Rails 3.1
Debian
Pentaho
Api
Pycharm
Omnet++
Composer Php
Swift2
Character Encoding
Uiview
Curl
Kibana
Hyperledger Fabric
Jsp
Oracle11g
.net 4.0
Openshift
3d
Functional Programming
Autocomplete
Paypal
Opengl
Maven
Struts2
Terraform
Nest
Extjs4
Zend Framework
Google Maps Api 3
Plugins
Multithreading
Symfony
Dns
Amazon Dynamodb
Discord.py
Compression
Mpi
Architecture
Asp.net Core
Url
Computer Vision
Silverstripe
Angularjs
Amazon Cloudformation
Rx Java
Process
D
File Upload
Swift3
Doctrine Orm
Azure Functions
Julia
Ecmascript 6
Visual Studio 2013
Hive
Bison
Google Visualization
Activerecord
Iphone
Gwt
Youtube
Function
Oauth 2.0
Web Scraping
Odoo
Ignite
Merge
Gatsby
Node.js
Azure Data Factory
Grep
Oracle Apex
Jquery
Mapping
Push Notification
C++11


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网