如何解析R中的HTML节点_Html_R_Parsing - Fatal编程技术网

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/3/html/73.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
如何解析R中的HTML节点_Html_R_Parsing - Fatal编程技术网

如何解析R中的HTML节点

html r parsing

如何解析R中的HTML节点,html,r,parsing,Html,R,Parsing,我以前用R编写过代码，但从来没有用HTML做过任何事情，所以请容忍我我建立了一个脚本来获取一些关于学校的有用信息，这里是它的要点： source <- html(url) address_phone_information <- html_node(source, css = "h4") 理想情况下，我只想取出地址信息（801 East Arctic Street，Palmer，AK 99645-6179）以及电话号码（907-746-2358），并将它们存储在两个不同的变量地址

我以前用R编写过代码，但从来没有用HTML做过任何事情，所以请容忍我

我建立了一个脚本来获取一些关于学校的有用信息，这里是它的要点：

source <- html(url)
address_phone_information <- html_node(source, css = "h4")

理想情况下，我只想取出地址信息（

801 East Arctic Street，Palmer，AK 99645-6179

）以及电话号码（

907-746-2358

），并将它们存储在两个不同的变量

地址和电话
更好的解决方案是将地址的不同部分存储在四个变量中，街道
，城市
，州
，和邮政编码
，但这似乎并不难做到，只要我将地址平方
对我如何做到这一点有什么建议吗？我也有其他学校要看，并希望使用完全相同的代码。另外，如果有帮助的话，我可以提供url。
查看packagervest
。它具有类似于html\u text
的功能，一旦您使用html\u node
定位了节点，它就可以进入节点内部，并提供了修剪空白的选项。似乎是一个管道字符（|）将地址和电话分开，因此str_split
与packagestringr
可能会有所帮助。如果地址格式非常一致，那么使用一些仔细的正则表达式从包stringr中提取stru
，应该可以得到地址中对我帮助很大的部分。我能够用str_split
解析出所有地址信息，str_trim帮助我消除了所有空白。
<h4>
                801 East Arctic Street, Palmer, AK 99645-6179            |
        907-746-2358              
        <a target="_blank" href="http://www.acc.matsuk12.us/">WEBSITE</a>                 </h4>




[r]相关文章推荐



                                                        
R 更改单个密度以匹配ggplot2中的图例
r 
R 数据帧中所有列的每n行的平均值和中位数，同时保留一个datetime对象作为索引
rdatetimedataframe 
R 匹配模式以从目录中选择文件
rdirectory 
计算列总数，然后对R中的结果进行排序
r 
“接收”；“未满足的依赖性”；在Ubuntu 14.10上安装r-base时
rubuntu 
从列表中生成频率数据帧，同时在R中保留行
r 
R 通过字符串分析合并数据帧行
rstringtextdataframe 
R：从点云中查找形状
r 
R 如何在一个data.table语句中联接并获取组中的行数？
r 
Monte Carlo模拟的闪亮应用程序
rshiny 
R 地图上的图例显示不正确
rdictionary 
用strftime从Posixct对象中提取日期和小时
rdatedatetime 
R 基于用户选择输入数量的条件面板
ruser-interfaceshiny 
R-箱线图x轴，无刻度，完整
r 
R 是否将鼠标悬停效果（例如工具提示）添加到一个（大型）plotly表格？
rshiny 
R中系数的可视化（点图）
r 
有没有办法用R来计算列中的单个方程？
rdataframe 
如何让R在下载文件时告诉我哪些链接断开了？
r 
R 仅当y值不同于0时，才使用颜色绘制ggplot2 geom_点
r 
R 我如何估计特定区间之间的统计分布值？
r 
                                       





随机文章推荐



                                                        
Mapping MapServer/OpenLayers的好例子
mappinggisopenlayers 
Mapping 方案：映射let和set！列入名单
mappingschemeracket 
Mapping 实体框架4.1代码优先方法：如何定义属性的长度
mapping 
Mapping EF 4.1中非导航属性的延迟加载
mapping 
Mapping 实体框架一对一关系插入时出错
mapping 
Mapping informatica映射以统计每个组织中的员工数量
mapping 
Elasticsearch 我可以将文本的默认类型定义为对象类型内的关键字吗？
mapping 
Mapping 如何判断序列是从配对端还是配对库读取配对？
mapping


                                        

                                        
                                        


                                                
                                                        [html]相关推荐
                                                        
                                                        
                                                

                                                
                                                        Tags
                                                        
Imagemagick
Salesforce
Linkedin
Makefile
Smalltalk
Python 2.7
Node.js
Ios
Orm
Symfony
Elixir
Google Compute Engine
Select
Json
Gitlab
Math
Listview
Dynamic
Fiware
Animation
Cygwin
C# 3.0
Pyspark
Vagrant
Combobox
Silverlight 4.0
Vb.net
Iis
Modelica
Ios4
Artificial Intelligence
Django
Rxjs
Php
Powerbi
Asp.net Mvc 5
Flash
Ignite
Dom
Checkbox
Data Binding
Tableau Api
Google Cloud Platform
Appium
Nginx
Google Maps Api 3
Events
Laravel
Linux
Apache Kafka
Apache2
Sphinx
Breeze
Ruby On Rails 3
Quickbooks
Grails
Asynchronous
Composer Php
Docker Compose
Rx Java
Llvm
Jasper Reports
Gridview
Umbraco
Winforms
Arrays
Image Processing
Google Plus
Google Apps Script
Amp Html
Knockout.js
Boost
Vba
Mips
Sql Server
Rss
Enums
Jboss
Hibernate
Mapping
Ssas
Cucumber
Swift
Active Directory
C++ Cli
Jestjs
Drupal
Scrapy
Doctrine
Matrix
Windows Runtime
Google Analytics
Opencart
Gstreamer
Join
Workflow
Web Services
Windows 10
Xaml
Url Rewriting
Jira
Graphics
Windows
Apache Flink
Google Cloud Storage
Yocto
Notifications
Gdb
Unicode
Performance
Tensorflow
Requirejs
Gcc
Visual Studio 2010
Netlogo
Hive
Firebase
Drop Down Menu
Ssrs 2008
Recursion
Sockets
Batch File
Haskell
Prestashop
Seo
Hbase
Vector
Office365
Twitter Bootstrap
Xml
Cypress
Orchardcms
Methods
Eclipse Rcp
Filesystems
Post
Dialogflow Es
Sml
Dataframe
Sass
Kdb
Youtube
Couchdb
Java Me
Twig
Google Chrome
Html
Ssh
Logstash
Automation
Elm
Nunit
Design Patterns
Multithreading
Antlr
Vbscript
Leaflet
Ant
Mdx
Forms
Oracle11g
Graphviz
Meteor
Julia
Pascal
Ipython
Qt4
Arm
Unity3d
Android Layout
Safari
Sharepoint 2010
Azure Devops
Asp.net Mvc
Teradata
Frameworks
Html5 Canvas
Cuda
Android Studio
Instagram
Azure
Javascript
Embedded
Gwt
Resharper
.net 4.0
Xcode4
Serialization
Windows 7
Django Rest Framework
Dependency Injection
Cakephp
Routing
Socket.io
Laravel 4
Scikit Learn
Binding
Reactjs
Apache Zookeeper
Localization
Ecmascript 6


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网