解析data.frame中的XML单列_R_Xml_Dplyr - Fatal编程技术网

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/0/xml/15.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
解析data.frame中的XML单列_R_Xml_Dplyr - Fatal编程技术网

解析data.frame中的XML单列

r xml

解析data.frame中的XML单列,r,xml,dplyr,R,Xml,Dplyr,我得到的数据是data.frame，但其中一列包含一个单元格，每个单元格包含几个xml元素像这样的 label_col = c("A", "B") number_col = c(123, 456) XML_col = c("<CD><TITLE>Empire Burlesque</TITLE><ARTIST>Bob Dylan</ARTIST></CD><CD&g

我得到的数据是data.frame，但其中一列包含一个单元格，每个单元格包含几个xml元素

像这样的

label_col = c("A", "B")

number_col = c(123, 456)

XML_col = c("<CD><TITLE>Empire Burlesque</TITLE><ARTIST>Bob Dylan</ARTIST></CD><CD><TITLE>Hide your heart</TITLE><ARTIST>Bonnie Tyler</ARTIST></CD>", 
             "<CD><TITLE>ABC</TITLE><ARTIST>XYZ</ARTIST></CD><CD><TITLE>EFG</TITLE><ARTIST>UVW</ARTIST></CD></CATALOG>")

Sample_df = data.frame(label_col, number_col, XML_col)

标签c（“A”、“B”）编号=c（123456） XML_col=c（“帝国城堡”Bob DylanHide your heartBonnie Tyler）， “ABCXYZEFGUVW”） Sample\u df=data.frame（标签、数字、XML）现在我可以看到每个单元格中的XML不是由一对标记包含的，所以我添加了它们

library(dplyr)

Sample_df %>%
mutate(XML_col = paste0("<Data>",XML_col,"</Data>"))

库（dplyr）
样本_df%>%
mutate（XML\u col=paste0（“，XML\u col，”））

现在，由于每个XML元素包含多（2）个项目，我希望我的数据帧从2x3变为4x4（列为……label\u col、number\u col、TITLE、ARTIST）

我卡住了！我尝试使用unnest和unnest_的时间更长了，但我真的不知道该怎么做

关于xml解析的大多数示例似乎都是从xml文件开始的，而不是上面提到的混合文件

谁能给我一头牛吗？（不要说哞！）

非常感谢

我将假设不匹配的

标记只是一个输入错误，您的实际输入是经过验证的、格式良好的XML

一般步骤如下：

将字符串解析到R类

xml\u文档中

将目标节点提取为列表列

取消列出列表列

下面演示了如何为

标题

节点执行此操作，但也应该为其他节点轻松复制

库（dplyr）
图书馆（purrr）
库（xml2）
图书馆（tidyr）
label_col@Markus我花了一点时间才回到问题上来，但你的解决方案非常有效。非常感谢！




[xml]相关文章推荐



                                                        
                                       





随机文章推荐



                                                        
Elasticsearch 我怎样做?&；和| |在嵌套中构造查询？
nest 
Elasticsearch 在多搜索查询中使用嵌套短语建议器
nest 
ElasticSearch-嵌套查询条件限制
nest 
_Elasticsearch中未自动生成id
nest 
elasticsearch-如何正确地将别名指向索引？
nest 
Elasticsearch 嵌套查询以在bool中写入must和should
nest 
无停机时间的ElasticSearch嵌套重新创建索引
nest


                                        

                                        
                                        


                                                
                                                        [r]相关推荐
                                                        
R中非标准分布曲线下的着色
									R
							 
R 如何有条件地高亮显示ggplot2刻面图中的点-将颜色映射到列
									R
							 									Plot
							 
R ggplot2堆叠条形图、格式和网格
									R
							 									Graph
							 									Plot
							 
我可以把这个dplyr+；data.table任务更快？
									R
							 
无法在data.table[，：=]函数中使用eval（parse（…）
									R
							 
RStudio 0.97.551在控制台中显示无法识别的字符
									R
							 									Encoding
							 
在X11上为R设置抗锯齿开罗默认显示
									R
							 
R 是否有一个函数可以将一个大数据帧拆分为n个大小相等的较小数据帧（按行），并具有一个n+；1个较小尺寸的数据帧？
									R
							 
R 缺少传递到热图的对象。2
									R
							 
用R
									R
							 
在R中将带标签的行转换为列的最佳方法
									R
							 
R 将整数转换为base36
									R
							 
辅助屏幕上全屏Powerpoint中的ggplot2 png
									R
							 									Plot
							 
R降价错误“；对象''；“未找到”；，用dplyr
									R
							 
在foreach循环中外推数据
									R
							 
R 为什么这个if/else错误出现在脚本中而不是控制台中？
									R
							 
在R中，当复制到的df有两个额外的列时，如何将行从一个数据帧复制到另一个数据帧？
									R
							 									Dataframe
							 
为什么我在使用两个看起来相同的稀疏矩阵创建Jaccard相似矩阵时会得到两种不同的性能
									R
							 
两列完整案例在R中的相关性-仅返回向量的第一个元素？
									R
							 
R加载包rJava和openNLP时出错
									R
							 
R 两个并排井面板的底部对齐
									R
							 									Shiny
							 
R 在另一列中提供具有连续值的名称列表
									R
							 
R 更改晶格打印轴标签
									R
							 									Plot
							 
R:For循环在列表上工作，而不是单个元素
									R
							 									For Loop
							 
R 对于包含多个值的循环，使用；我"；
									R
							 
R 将数据帧第一列中的数字替换为NA
									R
							 
R 绘制时间序列数据，其中第1列为
									R
							 
R 根据面_包裹更改抖动点的颜色
									R
							 
R ggplot2不添加负值的几何平滑
									R
							 
如何通过一个公共列连接两个表，并在R中的其他两列的数据之间筛选另一列
									R
							 									Sorting
							 									Join
							 									Filter
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Localization
Module
Terraform
Coding Style
Amazon S3
Opencv
Sdk
Linux
Ruby On Rails 3
Mpi
Windows Phone 8.1
Yii
Maven 2
Log4j
Angular6
Wolfram Mathematica
Reporting Services
Mono
Permissions
Uiview
Ldap
Twitter Bootstrap 3
Vector
Typescript
Yocto
Firebase
Antlr
Windows
Synchronization
Node.js
Vba
Twilio
Caching
Google Analytics
Encryption
Data Structures
Eclipse Plugin
Centos
Gdb
Ios6
Redux
Internet Explorer
Ssis
Mvvm
Cookies
Snowflake Cloud Data Platform
Ftp
Proxy
Keyboard
Asp.net Mvc 3
Prometheus
Antlr4
.net
Google Chrome Devtools
Templates
Sockets
Vb.net
Socket.io
Gwt
Lotus Notes
Smalltalk
Entity Framework Core
Mercurial
Hive
Reflection
Wpf
Xamarin.android
Memory Leaks
Gitlab
Testing
Laravel
Akka
Xslt
Select
Python
Jquery Ui
Parallel Processing
Doctrine Orm
Stm32
Sencha Touch 2
Webgl
Uml
Speech Recognition
Fortran
Twitter
File
Object
Cocos2d Iphone
Codenameone
Youtube
Asp.net Mvc 4
Kotlin
Wso2
Parse Platform
Recursion
Install4j
Extjs
Google App Engine
Dialogflow Es
String
Bots
Abap
Imagemagick
Apache Storm
Content Management System
Tcp
Ajax
Activerecord
Ruby On Rails
Frameworks
Phpstorm
Sencha Touch
Csv
Google Chrome Extension
Directory
Hibernate
Google Cloud Dataflow
Sqlite
Artifactory
Javafx
Ethereum
Exchange Server
For Loop
Jquery Mobile
Url Rewriting
Jersey
Kdb
Compression
Exception Handling
Path
Http
Ms Word
Sass
Orientdb
Vagrant
Opengl Es
Ember.js
Syntax
Ipython
View
Loopbackjs
Unit Testing
Webpack
Eclipse Rcp
Notifications
Bison
Android Fragments
Sbt
Pandas
Windows 8
Import
Aurelia
Discord
Glassfish
Windows 7
Ionic2
Jsf 2
Java
Oracle10g
Next.js
Isabelle
Visual Studio Code
Cassandra
Animation
Linkedin
Windows Installer
Kibana
Google Api
Delphi
Openshift
Ansible
Com
Character Encoding
Exception
Project Management
Visual Studio 2013
Windows Phone 8
Pagination
Less
Charts
Bazel
Datetime
Powerbi
Visual C++
Jms
Programming Languages
Sugarcrm
Linux Kernel
Udp
Entity Framework
C# 3.0
Talend
Azure
Hyperledger Fabric
Logstash
Vim
Geolocation
Gtk
Azure Functions
Vue.js
Express


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网