第一列的read.csv计数,第二列的read.table和read.delim计数?

第一列的read.csv计数,第二列的read.table和read.delim计数?,r,csv,read.table,R,Csv,Read.table,我对R完全是新手。 我有一些脚本从.cvs文件中读取数据来绘制它们。他们读取完整的表格,并在特定列(例如第6列)中绘制数据: 奇怪的是,现在柱子的编号已经改变了。“tabletab”中的第6列始终对应于“tablecsv”中的第7列。“tabletab”中的第1列对应于“tablecsv”中的第2列。因此,似乎通过使用read.table或read.delim,输入文件中的第一列被忽略或解释为注释。我似乎无法用任何参数关闭它。我尝试设置skip=0,但这并没有改变任何东西,而且还是默认参数。另外

我对R完全是新手。 我有一些脚本从.cvs文件中读取数据来绘制它们。他们读取完整的表格,并在特定列(例如第6列)中绘制数据:

奇怪的是,现在柱子的编号已经改变了。“tabletab”中的第6列始终对应于“tablecsv”中的第7列。“tabletab”中的第1列对应于“tablecsv”中的第2列。因此,似乎通过使用
read.table
read.delim
,输入文件中的第一列被忽略或解释为注释。我似乎无法用任何参数关闭它。我尝试设置
skip=0
,但这并没有改变任何东西,而且还是默认参数。另外,第一列不包含
#
字符,据我所知,这是默认的注释符号

有人对这种行为有什么解释吗?(我知道仅仅改变脚本中的列号并不难,只是这种行为对我来说毫无意义)

编辑: 下面是.csv和.tab输入文件的前几行:

myfile.csv:

name,A,B,C,D,E,F,G,H,I,J,K
xxx_NODE_25653_yyy_272_zzz_2.529412_1_312_-,0.242718447,0.35483871,0.166666667,0.2,0.368932039,0.451612903,0.333333333,0.418604651,0.333333333,0.763109267,0.711142183
xxx_NODE_22738_yyy_415_zzz_2.453012_1_455_+,0.152317881,0.1875,0.214285714,0.120879121,0.231788079,0.25,0.464285714,0.35,0.153846154,0.635002306,0.612372436
myfile.tab:

name    A   B   C   D   E   F   G   H   I   J   K
xxx_NODE_25653_yyy_272_zzz_2.529412_1_312_- 0.242718447 0.35483871  0.166666667 0.2 0.368932039 0.451612903 0.333333333 0.418604651 0.333333333 0.763109267 0.711142183
xxx_NODE_22738_yyy_415_zzz_2.453012_1_455_+ 0.152317881 0.1875  0.214285714 0.120879121 0.231788079 0.25    0.464285714 0.35    0.153846154 0.635002306 0.612372436
编辑2: 这就是我的tabletab现在的样子:

    > tabletab1[1:3,]
                                               name         A          B
  1     xxx_NODE_25653_yyy_272_zzz_2.529412_1_312_- 0.2427184 0.35483871
  2     xxx_NODE_22738_yyy_415_zzz_2.453012_1_455_+ 0.1523179 0.18750000
  3     xxx_NODE_52133_yyy_348_zzz_3.123563_1_388_- 0.1240310 0.06666667
            C         D         E         F         G         H         I
  1 0.1666667 0.2000000 0.3689320 0.4516129 0.3333333 0.4186047 0.3333333
  2 0.2142857 0.1208791 0.2317881 0.2500000 0.4642857 0.3500000 0.1538462
  3 0.1000000 0.1518987 0.2403101 0.1333333 0.3000000 0.2000000 0.2658228
            J         K
  1 0.7631093 0.7111422
  2 0.6350023 0.6123724
  3 0.7236342 0.5617433

>   tablecsv1[1:3,]
                                             name         A          B
1     xxx_NODE_25653_yyy_272_zzz_2.529412_1_312_- 0.2427184 0.35483871
2     xxx_NODE_22738_yyy_415_zzz_2.453012_1_455_+ 0.1523179 0.18750000
3     xxx_NODE_52133_yyy_348_zzz_3.123563_1_388_- 0.1240310 0.06666667
          C         D         E         F         G         H         I
1 0.1666667 0.2000000 0.3689320 0.4516129 0.3333333 0.4186047 0.3333333
2 0.2142857 0.1208791 0.2317881 0.2500000 0.4642857 0.3500000 0.1538462
3 0.1000000 0.1518987 0.2403101 0.1333333 0.3000000 0.2000000 0.2658228
          J         K
1 0.7631093 0.7111422
2 0.6350023 0.6123724
3 0.7236342 0.5617433
现在好像好了。然而,这些都是在我稍微模糊了示例名称后,用excel重新保存的输入文件。原始文件生成的结果如下所示:

表1[1:3,] 说出一个 xxx_节点_25653_yyy_272_zzz_2.529412_1_312_-0.2427184 0.35483871 xxx_节点_22738_yyy_415_zzz_2.453012_1_455_+0.1523179 0.18750000 xxx_节点_52133_yyy_348_zzz_3.123563_1_388_-0.1240310 0.06666667 B xxx_节点_25653_yyy_272_zzz_2.529412_1_312_-0.1666667 xxx_节点_22738_yyy_415_zzz_2.453012_1_455_+0.2142857 xxx_节点_52133_yyy_348_zzz_3.123563_1_388_-0.1000000 C xxx_节点_25653_yyy_272_zzz_2.529412_1_312_-0.2000000 xxx_节点_22738_yyy_415_zzz_2.453012_1_455_+0.1208791 xxx_节点_52133_yyy_348_zzz_3.123563_1_388_-0.1518987

因此,“name”列包含在其他每一列中。 包含的这些文件是由在unix下运行的java程序生成的,该程序似乎对“\t”和“\n”使用了其他元字符(在文本编辑器中看不到)
所以问题解决了,我想,但既然我在unix机器上运行java程序,并且在unix机器上运行R,如果我发现在windows操作系统上使用Excel重新保存表后,这些表工作得更好,这很奇怪吗?另外,当我在任何表上运行Dos2Unix时,它们会再次得到这些元字符,这会导致这些问题。

如果没有实际的文件,这真的很难调试。你能把这两种文件的前几行都贴出来吗?是否确定以制表符分隔的文件中没有额外的制表符?请发布源文件的可复制示例。同时,试着键入
tablecsv[1:3,]
tabletab[1:3,]
来查看您实际加载了什么。无法用给定的数据重现您的问题。我不这么认为。为什么不使用文本编辑器构建一些人工的、全新的以制表符和逗号分隔的文件,并尝试重现这些文件的问题呢。我猜您的原始输入文件存在一些您忽略的格式问题。再次声明:请发布类似的
tablecsv
tabletab
示例,以便我们可以看到每个列中的实际内容!
name    A   B   C   D   E   F   G   H   I   J   K
xxx_NODE_25653_yyy_272_zzz_2.529412_1_312_- 0.242718447 0.35483871  0.166666667 0.2 0.368932039 0.451612903 0.333333333 0.418604651 0.333333333 0.763109267 0.711142183
xxx_NODE_22738_yyy_415_zzz_2.453012_1_455_+ 0.152317881 0.1875  0.214285714 0.120879121 0.231788079 0.25    0.464285714 0.35    0.153846154 0.635002306 0.612372436
    > tabletab1[1:3,]
                                               name         A          B
  1     xxx_NODE_25653_yyy_272_zzz_2.529412_1_312_- 0.2427184 0.35483871
  2     xxx_NODE_22738_yyy_415_zzz_2.453012_1_455_+ 0.1523179 0.18750000
  3     xxx_NODE_52133_yyy_348_zzz_3.123563_1_388_- 0.1240310 0.06666667
            C         D         E         F         G         H         I
  1 0.1666667 0.2000000 0.3689320 0.4516129 0.3333333 0.4186047 0.3333333
  2 0.2142857 0.1208791 0.2317881 0.2500000 0.4642857 0.3500000 0.1538462
  3 0.1000000 0.1518987 0.2403101 0.1333333 0.3000000 0.2000000 0.2658228
            J         K
  1 0.7631093 0.7111422
  2 0.6350023 0.6123724
  3 0.7236342 0.5617433

>   tablecsv1[1:3,]
                                             name         A          B
1     xxx_NODE_25653_yyy_272_zzz_2.529412_1_312_- 0.2427184 0.35483871
2     xxx_NODE_22738_yyy_415_zzz_2.453012_1_455_+ 0.1523179 0.18750000
3     xxx_NODE_52133_yyy_348_zzz_3.123563_1_388_- 0.1240310 0.06666667
          C         D         E         F         G         H         I
1 0.1666667 0.2000000 0.3689320 0.4516129 0.3333333 0.4186047 0.3333333
2 0.2142857 0.1208791 0.2317881 0.2500000 0.4642857 0.3500000 0.1538462
3 0.1000000 0.1518987 0.2403101 0.1333333 0.3000000 0.2000000 0.2658228
          J         K
1 0.7631093 0.7111422
2 0.6350023 0.6123724
3 0.7236342 0.5617433