Ruby on rails Rails，从动态URL抓取_Ruby On Rails_Web Scraping - Fatal编程技术网

Ruby on rails Rails，从动态URL抓取

ruby-on-rails web-scraping

Ruby on rails Rails，从动态URL抓取,ruby-on-rails,web-scraping,Ruby On Rails,Web Scraping,在最基本的情况下，我想刮一个网站，并呈现部分代码，如所有的H1或其他东西。我过去使用过Nokogiri和Mechanize，并且熟悉刮削的基础知识。在过去，我会像这样构建一个thor任务 class Scrape < Thor desc "cl_redding","Scrape Craigslist for Rentals" def cl_redding require File.expand_path('config/environment.rb') require

在最基本的情况下，我想刮一个网站，并呈现部分代码，如所有的H1或其他东西。我过去使用过Nokogiri和Mechanize，并且熟悉刮削的基础知识。在过去，我会像这样构建一个thor任务

class Scrape < Thor
desc "cl_redding","Scrape Craigslist for Rentals"
def cl_redding

    require File.expand_path('config/environment.rb')

    require 'rubygems'

    require 'nokogiri'

    require 'open-uri'

    require 'mechanize'

    require 'yaml'

    require 'aws-sdk'

    require 'csv'

    require 'json'

    agent = Mechanize.new

    page = agent.get('http://redding.craigslist.org/search/apa?zoomToPosting=&catAbb=apa&query=&minAsk=&maxAsk=&bedrooms=&housing_type=&hasPic=1&excats=')

class Scrape


这一切都很酷，也很管用，尽管它只会抓取craigslist，而且因为我特别通过page=，所以我要问的是，有人对我如何从网站的输入框中抓取一个名为的网站有什么建议吗？欢迎提供具体的帮助、教程、建议或资源。
我认为您的问题有点过于笼统

你需要启动一个rails应用程序
构建一个表单来接受要刮取的url的输入-可能实现一个页面模型来存储要刮取的页面
按照示例中的方式解析url
可能使用后端处理工具，如sidekiq，以避免前端刮伤
存储结果并将其显示在第#显示页




[web scraping]相关文章推荐



                                                        
Web scraping 维基百科文章名称（无内容）
web-scraping 
Web scraping 一个基本的爬虫/刮板，可以提供父URL下的所有URL
web-scrapingweb-crawler 
Web scraping 删除这种类型的站点架构可能吗？
web-scraping 
Web scraping 如何在过度刮网后解除阻塞？
web-scraping 
Web scraping 刮痕：如果节点包含子节点
web-scrapingscrapy 
Web scraping Instagram数据抓取/爬行
web-scrapingweb-crawlerinstagram 
Web scraping 从交互式图表中删除
web-scrapingscrapy 
Web scraping 为什么数据在Scrapy中没有完全加载视图（响应）？
web-scrapingscrapy 
Web scraping 刮下一页，没有意义的结果
web-scrapingscrapy 
Web scraping 用户警告：未安装SoupSive软件包。不能使用CSS选择器
web-scraping 
Web scraping 如何使用scrapy刮取隐藏在下拉菜单中的链接？
web-scrapingscrapy 
Web scraping 如何在cloudscraper中使用代理
web-scrapingproxy 
                                       





随机文章推荐



                                                        
Excel 将指定行和列复制到包含自动求和功能的新工作簿
excelvba 
基于命名数组中单元格值的Excel VLOOKUP
excelexcel-formula 
用于检测Excel中重复数据的公式（带有一个困难的变量！）
excelexcel-formula 
Excel-搜索列以查找文本是否匹配并计算字符串
excel 
使用jxls在excel中为未知大小的集合生成图表
excelcharts 
重新填充Excel合并单元格
excelmerge 
Excel VBA代码来记住之前选择的文件
excelvba 
检查除'以外的值；1'；在excel列中，显示MsgBox
excelvba 
如何在Excel中计算一年中的会计日？
exceldateexcel-formula 
Excel Python将特定行从.csv复制到.xlsx，前提是第三列中有特定值
excelcsvpython-3.x 
Excel 在VBA中引用活动表
excelvba 
Excel 在单元格中查找部分文本
excel 
Excel 当MainWindowHandle为0时将窗口置于前台
excelpowershellwinapi 
如何从多个关闭的excel工作簿中提取数据，以便通过VBA将其放置在不同工作表的单独工作簿中？
excelvba 
从记事本复制并粘贴到Excel工作表的最后一行
excelvba 
Excel 将不同图纸中的数据粘贴到一张图纸（一张接一张）
excelvba 
是否有Excel公式返回活动数据字符串中的哪一点，数据更改形式（从1到2）？
excel 
Excel 快速方式突出显示每2行，跳过一些列
excelvbaexcel-formula 
Excel-基于多列（包括日期）获取唯一计数
excelexcel-formula 
如何使用VBA Excel代码向具有过期信息的用户显示弹出消息
excelvbadate


                                        

                                        
                                        


                                                
                                                        [ruby on rails]相关推荐
                                                        
Ruby on rails RubyonRails:Multiple有多个：可能吗？
									Ruby On Rails
							 
Ruby on rails 声明性\u授权和/或授权\u规则访问问题
									Ruby On Rails
							 
Ruby on rails 如何创建适用于无限滚动加载行为的方法查询
									Ruby On Rails
							 									Ruby On Rails 3
							 									Activerecord
							 
Ruby on rails 如何为基于ajax的应用程序构建rails 3控制器和视图
									Ruby On Rails
							 									Ruby On Rails 3
							 
Ruby on rails 向Ruby中的属性添加方法
									Ruby On Rails
							 									Ruby
							 									Methods
							 
Ruby on rails Box.com api将URL重定向到本地主机
									Ruby On Rails
							 
Ruby on rails 博客的第一个场景
									Ruby On Rails
							 									Cucumber
							 
Ruby on rails Kaminari视图中的url错误
									Ruby On Rails
							 									Ruby On Rails 3.2
							 									Pagination
							 
Ruby on rails Rails Postgresql时间列
									Ruby On Rails
							 									Time
							 
Ruby on rails 合并大量PDF Rails
									Ruby On Rails
							 									Ruby
							 									Pdf
							 
Ruby on rails Rails应用程序未使用my xls视图
									Ruby On Rails
							 									Ruby On Rails 3
							 									Excel
							 
Ruby on rails rails中nil:NilClass错误的未定义方法“[]”
									Ruby On Rails
							 									Ruby On Rails 4
							 
Ruby on rails RVM无法安装Ruby
									Ruby On Rails
							 									Ruby
							 
Ruby on rails 设计：在不确认密码的情况下更新帐户
									Ruby On Rails
							 									Ruby
							 
Ruby on rails rails上的关联层和描述
									Ruby On Rails
							 									Database
							 
Ruby on rails RoR上post的不同响应时间
									Ruby On Rails
							 									Ruby
							 									Ruby On Rails 4
							 									Heroku
							 
Ruby on rails 设计-无法更新电子邮件或密码-使用默认配置
									Ruby On Rails
							 
Ruby on rails Rails 3应用程序未创建production.log
									Ruby On Rails
							 									Ruby
							 									Ruby On Rails 3
							 
Ruby on rails 回形针宝石在生产中不起作用
									Ruby On Rails
							 									Heroku
							 
Ruby on rails 服务.js和.css资产时出现问题cloudfront CDN Heroku Rails 4应用程序
									Ruby On Rails
							 									Heroku
							 
Ruby on rails 如何向成功rspec消息添加自定义文本
									Ruby On Rails
							 									Ruby
							 									Rspec
							 
Ruby on rails Capistrano配置符号链接不工作
									Ruby On Rails
							 
Ruby on rails Rails：条带表单被发布两次
									Ruby On Rails
							 									Stripe Payments
							 
Ruby on rails 如何从隐藏字段传递参数？
									Ruby On Rails
							 									Ruby On Rails 4
							 
Ruby on rails 由于安装了X射线，指令的模板必须只有一个根元素
									Ruby On Rails
							 									Angularjs
							 									Coffeescript
							 
Ruby on rails 轨道路由错误。没有路由错误
									Ruby On Rails
							 									Ruby
							 									Routes
							 
Ruby on rails 在Ruby中，减量（-=）函数在0处停止
									Ruby On Rails
							 									Ruby
							 
Ruby on rails 如何将paper_trail的whodunnit列从字符串迁移到整数？
									Ruby On Rails
							 
Ruby on rails 在rails 6上未触发保存回调之前
									Ruby On Rails
							 
Ruby on rails 未初始化常量（NameError）Ruby
									Ruby On Rails
							 									Ruby
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Opengl
Actionscript 3
Server
Doctrine
Email
Utf 8
Spring Mvc
Validation
Playframework 2.0
Matrix
Logging
Synchronization
Windbg
Oracle11g
Odoo
Windows Phone 8.1
Arrays
Telegram
Datatables
Mariadb
Cron
Elixir
Autodesk Forge
Opencart
Cocos2d X
Computer Vision
Mule
Wcf
Stm32
Linker
Download
Airflow
Mips
Laravel
Uwp
Php
Installation
Appium
Apache Camel
Data Binding
Visual C++
Floating Point
Actionscript
Neural Network
Scripting
Struts2
Ocaml
Selenium
Backbone.js
Azure Service Fabric
Html
Sublimetext3
Checkbox
Cocoa Touch
Zend Framework
Sql Server 2008
Pentaho
Proxy
Nestjs
Push Notification
Pagination
Linux
Tfs
Random
Julia
Blazor
Unicode
Facebook Graph Api
Tcl
Tridion
Nunit
Asp Classic
Dynamic
Asp.net Web Api
Qt4
Apache Storm
Programming Languages
Racket
Vue.js
Cobol
Hyperlink
Kubernetes
Ios4
C
Postman
Facebook
Opencl
Templates
Windows 7
Silverlight 4.0
Angular6
Netlogo
Sas
Coq
Macros
Azure Devops
Camera
Udp
Woocommerce
Azure
Numpy
Build
Ethereum
Time
Apache Spark
Google Maps Api 3
Xml
Mqtt
Uitableview
Cluster Computing
Language Agnostic
Netbeans
Cypress
Install4j
For Loop
Binary
Big O
Playframework
Filesystems
Fortran
Ipython
Dynamics Crm 2011
Data Structures
Exception
Maps
Mongoose
Transactions
Ecmascript 6
Reactjs
Windows Services
Fonts
C# 4.0
Typo3
Serial Port
Aframe
Orchardcms
Doxygen
Scikit Learn
Rally
Django Models
Logic
Coldfusion
Javascript
Grails
Regex
Docusignapi
Redux
Google Cloud Dataflow
Keycloak
Domain Driven Design
Resharper
Io
Arm
Tcp
EmptyTag
Quickbooks
Dictionary
Sharepoint 2010
Dojo
Hazelcast
Azure Functions
Abap
Bash
Google Cloud Firestore
Ckeditor
Gitlab
Web Scraping
Scala
Gstreamer
Security
Process
Asp.net Core Mvc
Jboss
Flash
View
Subsonic
Button
Ibm Midrange
Documentation
Sugarcrm
Tableau Api
Ms Access
Glassfish
Lua
Sql Server 2005
Rdf
Jmeter
Character Encoding
Error Handling
Visual Studio Code
Exception Handling
Sml
Image Processing
Tensorflow
Ibm Mobilefirst
Linux Kernel
Mapreduce
Xamarin
Iis
.net Core
Bots


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网