R:拆分连接的csv

R:拆分连接的csv,r,R,我有一个大数据文件,其中包含多个连接或“粘合”在一起的数据帧 Wvlgth Global_horizn_irradiance .2820E+04 .1958E-08 .2840E+04 .3041E-05 .2860E+04 .1284E-03 .2880E+04 .6259E-03 .2900E+04 .1530E-02 .2920E+04 .4437E-02 Wvlgth Global_horizn_irradiance .3000E+03 .5965E-02 .3200E+03 .3408

我有一个大数据文件,其中包含多个连接或“粘合”在一起的数据帧

Wvlgth Global_horizn_irradiance
.2820E+04 .1958E-08
.2840E+04 .3041E-05
.2860E+04 .1284E-03
.2880E+04 .6259E-03
.2900E+04 .1530E-02
.2920E+04 .4437E-02
Wvlgth Global_horizn_irradiance
.3000E+03 .5965E-02
.3200E+03 .3408E+00
.3400E+03 .6779E+00
.3600E+03 .7522E+00
.3800E+03 .8358E+00
.4000E+03 .1276E+01
Wvlgth Global_horizn_irradiance
.3800E+03 .8358E+00
.4000E+03 .1276E+01
...etc.
我希望以这样的方式读取此文件:它是一个没有标题行的数据帧:

Wvlgth Global_horizn_irradiance
.2820E+04 .1958E-08
.2840E+04 .3041E-05
.2860E+04 .1284E-03
.2880E+04 .6259E-03
.2900E+04 .1530E-02
.2920E+04 .4437E-02
.3000E+03 .5965E-02
.3200E+03 .3408E+00
.3400E+03 .6779E+00
.3600E+03 .7522E+00
.3800E+03 .8358E+00
.4000E+03 .1276E+01
.3800E+03 .8358E+00
.4000E+03 .1276E+01
...etc.
因为当我现在读到它时,列被解释为因子,而as.numeric被搞砸了(我需要列是数字的,这样我就可以绘制它们):


我的数学不是最好的,但我很确定。2820E+04实际上和101不一样。除非我读错了。

最好的办法是使用
读线
读取文件,使用正则表达式或类似功能删除“头”,然后将所有内容强制为data.frame。如果您能够控制它,那么您最好的选择就是首先强制将更漂亮的输出输出到csv。也许有一些unix工具可以让您根据某一行分割文件。。。将多个文件导入到R中是很简单的。如果值中没有任何
NA
,则可以使用
stringsAsFactors=FALSE
加载csv,将其转换为数值(
df$Wvlgth=as.numeric(df$Wvlgth)
)并删除引入NA的行(
df=df[complete.cases(df),]
)如果您对编辑源文件感兴趣,这将删除所有包含“Wvlgth”-->
type file.txt | findstr/v Wvlgth
的行,这是在cmd中。@Jealie已经工作了,谢谢!而且整个文件的头并不总是相同的,因此很遗憾,执行任何类型的查找/替换都非常困难。很抱歉没提那件事
> as.numeric(df$Wvlgth)
  [1] 101 103 104 105 106 107 108 109 110