R：拆分连接的csv_R - Fatal编程技术网

R：拆分连接的csv

R：拆分连接的csv,r,R,我有一个大数据文件，其中包含多个连接或“粘合”在一起的数据帧 Wvlgth Global_horizn_irradiance .2820E+04 .1958E-08 .2840E+04 .3041E-05 .2860E+04 .1284E-03 .2880E+04 .6259E-03 .2900E+04 .1530E-02 .2920E+04 .4437E-02 Wvlgth Global_horizn_irradiance .3000E+03 .5965E-02 .3200E+03 .3408

我有一个大数据文件，其中包含多个连接或“粘合”在一起的数据帧

Wvlgth Global_horizn_irradiance
.2820E+04 .1958E-08
.2840E+04 .3041E-05
.2860E+04 .1284E-03
.2880E+04 .6259E-03
.2900E+04 .1530E-02
.2920E+04 .4437E-02
Wvlgth Global_horizn_irradiance
.3000E+03 .5965E-02
.3200E+03 .3408E+00
.3400E+03 .6779E+00
.3600E+03 .7522E+00
.3800E+03 .8358E+00
.4000E+03 .1276E+01
Wvlgth Global_horizn_irradiance
.3800E+03 .8358E+00
.4000E+03 .1276E+01
...etc.

我希望以这样的方式读取此文件：它是一个没有标题行的数据帧：

Wvlgth Global_horizn_irradiance
.2820E+04 .1958E-08
.2840E+04 .3041E-05
.2860E+04 .1284E-03
.2880E+04 .6259E-03
.2900E+04 .1530E-02
.2920E+04 .4437E-02
.3000E+03 .5965E-02
.3200E+03 .3408E+00
.3400E+03 .6779E+00
.3600E+03 .7522E+00
.3800E+03 .8358E+00
.4000E+03 .1276E+01
.3800E+03 .8358E+00
.4000E+03 .1276E+01
...etc.

因为当我现在读到它时，列被解释为因子，而as.numeric被搞砸了（我需要列是数字的，这样我就可以绘制它们）：

我的数学不是最好的，但我很确定。2820E+04实际上和101不一样。除非我读错了。

最好的办法是使用

读线

读取文件，使用正则表达式或类似功能删除“头”，然后将所有内容强制为data.frame。如果您能够控制它，那么您最好的选择就是首先强制将更漂亮的输出输出到csv。也许有一些unix工具可以让您根据某一行分割文件。。。将多个文件导入到R中是很简单的。如果值中没有任何

NA

，则可以使用

stringsAsFactors=FALSE

加载csv，将其转换为数值（

df$Wvlgth=as.numeric（df$Wvlgth）

）并删除引入NA的行（

df=df[complete.cases（df），]

）如果您对编辑源文件感兴趣，这将删除所有包含“Wvlgth”-->

type file.txt | findstr/v Wvlgth

的行，这是在cmd中。@Jealie已经工作了，谢谢！而且整个文件的头并不总是相同的，因此很遗憾，执行任何类型的查找/替换都非常困难。很抱歉没提那件事

> as.numeric(df$Wvlgth)
  [1] 101 103 104 105 106 107 108 109 110