Web scraping 未定义刮痕项目_Web Scraping_Scrapy_Scrapy Spider - Fatal编程技术网

Web scraping 未定义刮痕项目

web-scraping scrapy

Web scraping 未定义刮痕项目,web-scraping,scrapy,scrapy-spider,Web Scraping,Scrapy,Scrapy Spider,我正在写一个爬虫程序从Yelp那里获取一些页面。我对Yelp项的定义如下： yelpItem.py： import scrapy class YelpItem(scrapy.Item): # define the fields for your item here like: name = scrapy.Field() link = scrapy.Field() 在spider文件夹中，我在parse函数中使用YelpItem def parse(self, resp

我正在写一个爬虫程序从Yelp那里获取一些页面。我对Yelp项的定义如下：

yelpItem.py

：

import scrapy

class YelpItem(scrapy.Item):
    # define the fields for your item here like:
    name = scrapy.Field()
    link = scrapy.Field()

在spider文件夹中，我在

parse

函数中使用

YelpItem

def parse(self, response):
    hxs = HtmlXPathSelector(response)
    sites = hxs.select('//h3/span/a[contains(@class, "biz-name")]')
    items = []
    for site in sites:
        item = YelpItem()

运行时，它会显示：

NameError: global name 'YelpItem' is not defined

我搜索了几个网页，并尝试添加如下代码：

from hw1.items import YelpItem

（hw1是我的项目名称），但它没有帮助。这将导致如下错误：

没有模块命名项

有谁能帮我弄清楚怎么处理这个问题吗？谢谢

使用

from hw1.yelpItem import YelpItem

因为当您尝试从hw1.items中执行

操作时，您引用的是items.py
文件，但是您的YelpItem
位于YelpItem.py
文件中，您还必须更新导入路径
您可以阅读背景资料，了解原因。
非常感谢！虽然我通过将项目文件的名称改回items.py解决了这个问题




[scrapy]相关文章推荐



                                                        
Ubuntu web服务器上的Scrapy出现417错误
scrapy 
Win10刮片安装
我有Python安装以及C++编译器。当我从命令行运行“pip install scrapy”时，它会开始安装，但在libxml和libxslt周围会出现一些错误
scrapyinstallationwindows-10 
为什么我的scrapy ItemLoader失败了？
scrapy 
Scrapy 刮皮不'；t下载图片
scrapy 
Scrapy response.follow查询
scrapy 
Scrapy 在另一个Spider上解析页面后调用另一个Spider
scrapy 
Scrapyd部署：未找到SPIDER_模块
scrapy 
Scrapy-从表中提取数据
scrapy 
我能'；t使用scrapy提取链接
scrapy 
scrapy Pipeline TypeError:只能将str（而不是“dict”）连接到str
scrapy 
                                       





随机文章推荐



                                                        
在vagrant中将变量传递给shell脚本供应器
vagrant 
Vagrant 我的虚拟机物理上在哪里？
vagrant 
Vagrant 流浪汉
vagrant 
Vagrant同步文件夹选项
vagrant 
来自服务器的空回复-can'；t连接到带有端口转发的vagrant vm
vagrant 
Vagrant 如何将NAT接口添加为eth1而不是eth0
vagrant 
Vagrant 具有etcd依赖项的deis映像在执行bin/boot脚本时出错：“；在4001等待etcd…“；
vagrantdocker 
如何将nfs用于特定于vagrant sync的文件夹？

主机：OSXMavericks
来宾计算机：Ubuntu 14.04
虚拟机软件：VirtualBox 4.3.14
vagrant 
Vagrant 在Yum更新后未找到Cookbook
vagrantchef-infra 
在Windows上运行Vagrant:安装配置时出错
vagrant 
无法在Linux来宾（Vagrant）中装载文件夹
vagrantvirtual-machinevirtualbox 
Vagrant Couchbase无法访问web控制台
vagrantcouchbase 
Vagrant 无法创建绑定装载目标路径“/var/www”已经是bindfs装载
vagrantvirtual-machine 
Vagrant 如何检查流浪汉的进度
vagrant 
Vagrant 你能在虚拟机内部执行流浪规定吗？
vagrant 
Vagrant在执行'时抛出错误；流浪者上'；
vagrant 
Vagrant 厨师从未成功完成
vagrantchef-infra 
Vagrant没有同步文件
vagrant 
Vagrant Can'；t连接到上的MiniKF登录页http://10.10.10.10 安装MiniKF后
vagrantvirtualbox 
带有Vagrant/PhpStorm的Xdebug配置
vagrantphpstorm


                                        

                                        
                                        


                                                
                                                        [web scraping]相关推荐
                                                        
Web scraping 刮削：检查wiki页面是否为个人页面
									Web Scraping
							 
Web scraping 这样的一页怎么刮？
									Web Scraping
							 									Scrapy
							 
Web scraping 通过PHP PhantomJS将脚本传递给PhantomJS的正确方法？
									Web Scraping
							 									Phantomjs
							 
Web scraping 获取一组属性类型的列表
									Web Scraping
							 
Web scraping 下载整个网页并使用urllib.request将其另存为html文件
									Web Scraping
							 
Web scraping 吃披头士汤
									Web Scraping
							 
Web scraping 刮擦启用项目管道
									Web Scraping
							 									Scrapy
							 									Web Crawler
							 
Web scraping 如何使用HTML5解析页面并找到所有链接？
									Web Scraping
							 									Rust
							 
Web scraping 如何查找动态加载内容的源
									Web Scraping
							 									Google Chrome Devtools
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Active Directory
Backbone.js
Nhibernate
Xslt
Wso2
Xamarin
Silverlight 4.0
Firefox
Google Bigquery
Couchdb
Extjs4
Extjs
Reactjs
Tree
Kibana
Grafana
Tomcat
Dask
Laravel 5
Protractor
Dependencies
Asp.net Web Api
Sitecore
For Loop
Salesforce
Compilation
Acumatica
Julia
Bison
Haskell
Object
Nuget
Nest
Libgdx
Soap
Css
Oop
Devexpress
Mapreduce
Mfc
Plot
Svg
Ruby
Compiler Errors
Perforce
Jestjs
Joomla
Signalr
Adobe
Frameworks
Git
Xml
Jms
Phpunit
Amazon Dynamodb
Ffmpeg
Sml
Printing
Javafx
Google App Engine
Paypal
Doctrine Orm
3d
Multithreading
Tsql
Dynamics Crm
Symfony
Internet Explorer
Activerecord
Corda
Directory
Razor
Azure Service Fabric
Uitableview
Clearcase
Linker
Cocoa Touch
Jasmine
C# 3.0
Single Sign On
Memory
Vagrant
Awk
Markdown
Gstreamer
C++
Yii2
Testng
Gdb
Apache Camel
Firefox Addon
Yocto
Automated Tests
Qt
Url Rewriting
Mpi
Apache Zookeeper
Oracle Apex
Wcf
Drupal
Curl
Plugins
Blockchain
Scripting
Mapping
Python Sphinx
Mvvm
Jhipster
Windows 10
Stata
Parallel Processing
Office Js
Outlook
Dictionary
Html
Breeze
Facebook
Less
Jsf
Mongoose
Xaml
Compression
Karate
Exchange Server
Cloud Foundry
Zurb Foundation
Amazon S3
Jdbc
Logic
Mediawiki
Firebase
Linq
Z3
Big O
Migration
Replace
Encoding
Material Ui
Selenium Webdriver
Fortran
Discord.py
Dll
Bots
Asp.net Core
Twitter
Pine Script
Kdb
Ionic2
Django Models
Sdk
Antlr4
Drupal 6
Configuration
Ag Grid
Meteor
Arm
Performance
Statistics
Language Agnostic
R
Http
Kotlin
C++ Cli
Content Management System
Algorithm
Validation
Excel Formula
Terraform
Cookies
Dynamic
Serialization
Pentaho
Design Patterns
Sql Server 2008 R2
Netbeans
Security
Math
Drupal 7
Robotframework
Workflow
Xsd
Directx
Optimization
Hash
Text
Azure
Vim
Tabs
Parsing
Influxdb
Qt4
Struct
Compiler Construction
Protocol Buffers
Google Cloud Storage
Routes
Odoo
Lucene
Node.js
Objective C
.net


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网