Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/r/65.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
R 2个csv文件返回不同的数据类型_R_Csv - Fatal编程技术网

R 2个csv文件返回不同的数据类型

R 2个csv文件返回不同的数据类型,r,csv,R,Csv,我有2个csv数据文件。一个是1分钟酒吧,另一个是5分钟酒吧。 这两个文件的格式相同 文件1是 > 2007-01-02 10:00:00.000,NIFTY,ABB,2007-01-02 10:00:00.000,750.4,750.4,750,750.2 2007-01-02 10:01:00.000,NIFTY,ABB,2007-01-02 10:01:00.000,750.38,750.4,749.8,749.8 2007-01-02 10:02:00.000,NIFTY,

我有2个csv数据文件。一个是1分钟酒吧,另一个是5分钟酒吧。 这两个文件的格式相同

文件1是

> 2007-01-02 10:00:00.000,NIFTY,ABB,2007-01-02 10:00:00.000,750.4,750.4,750,750.2
  2007-01-02 10:01:00.000,NIFTY,ABB,2007-01-02 10:01:00.000,750.38,750.4,749.8,749.8
  2007-01-02 10:02:00.000,NIFTY,ABB,2007-01-02 10:02:00.000,749.8,750,749.6,750
  2007-01-02 10:03:00.000,NIFTY,ABB,2007-01-02 10:03:00.000,749.6,752.4,749.6,752
  2007-01-02 10:04:00.000,NIFTY,ABB,2007-01-02 10:04:00.000,752,755.8,752,754.2
  2007-01-02 10:05:00.000,NIFTY,ABB,2007-01-02 10:05:00.000,754.02,755,752.05,753.6
  2007-01-02 10:06:00.000,NIFTY,ABB,2007-01-02 10:06:00.000,753,753,751,751
  2007-01-02 10:07:00.000,NIFTY,ABB,2007-01-02 10:07:00.000,751,751.62,750.5,751
  2007-01-02 10:08:00.000,NIFTY,ABB,2007-01-02 10:08:00.000,750.8,751,750.2,750.62 
文件2是

 > 2007-01-02 10:00:00.000,NIFTY,ABB,2007-01-02 10:00:00.000,750.2,754.2,749.8,753.6
   2007-01-02 10:05:00.000,NIFTY,ABB,2007-01-02 10:05:00.000,753.6,753.6,750.62,752.8
   2007-01-02 10:10:00.000,NIFTY,ABB,2007-01-02 10:10:00.000,752.8,752.8,750.2,751.5
   2007-01-02 10:15:00.000,NIFTY,ABB,2007-01-02 10:15:00.000,751.5,752,751,751.6
   2007-01-02 10:20:00.000,NIFTY,ABB,2007-01-02 10:20:00.000,751.6,751.6,750.8,751
   2007-01-02 10:25:00.000,NIFTY,ABB,2007-01-02 10:25:00.000,751,751.2,749,749
   2007-01-02 10:30:00.000,NIFTY,ABB,2007-01-02 10:30:00.000,749,751.8,749,751.8
   2007-01-02 10:35:00.000,NIFTY,ABB,2007-01-02 10:35:00.000,751.8,752,751.1,751.4
现在我运行
a不看实际文件很难说。这些列中可能隐藏了一些字符

要找到答案,请使用
read.csv
中的
stringsAsFactors=F
将因子读取为字符。接下来,使用
as.numeric
将字符列转换为数字。这将引入NAs来代替实际字符。最后使用
is.na


注意:可以使用
as.numeric
将系数类型转换为数值,但在这种情况下会产生不希望的结果

不看实际文件很难说。这些列中可能隐藏了一些字符

要找到答案,请使用
read.csv
中的
stringsAsFactors=F
将因子读取为字符。接下来,使用
as.numeric
将字符列转换为数字。这将引入NAs来代替实际字符。最后使用
is.na


注意:可以使用
as.numeric
将系数类型转换为数值,但在这种情况下会产生不希望的结果

当我将示例数据粘贴到两个文件中,并使用
read.csv()
读取这两个文件时,前四列都是因子,第二组四列都是数字,因此很遗憾,我无法复制您的问题。可能是文件中的某些内容没有包含在您的示例中

当我将“file2.csv”修改为:

。。。我确实发现,最后四列是作为因子读入的,因此我认为在“file2.csv”的这些列中可能有非数字数据

我还注意到,您可能希望使用以下内容:

a<-read.csv("file1.csv",header=F)
b<-read.csv("file2.csv",header=F)

a当我将示例数据粘贴到两个文件中,并使用
read.csv()
读取这两个文件时,前四列都是因子,第二组四列都是数字,因此很遗憾,我无法复制您的问题。可能是文件中的某些内容没有包含在您的示例中

当我将“file2.csv”修改为:

。。。我确实发现,最后四列是作为因子读入的,因此我认为在“file2.csv”的这些列中可能有非数字数据

我还注意到,您可能希望使用以下内容:

a<-read.csv("file1.csv",header=F)
b<-read.csv("file2.csv",header=F)

a问题是否仅发生在该数据上,或者是否存在其他行?也许第二个文件中有一行包含字符串?我相信R会将行中的所有内容强制转换为字符串,默认情况下,它会将字符串转换为因子。(请参见
stringsAsFactors
参数至
read.table
)问题是否仅发生在该数据上,或者是否存在其他行?也许第二个文件中有一行包含字符串?我相信R会将行中的所有内容强制转换为字符串,默认情况下,它会将字符串转换为因子。(请参见
stringsAsFactors
参数至
read.table
)感谢您的帮助。它确实解决了我的问题。我的文件在一个单元格中实际为空。当我删除空值时,它就工作了。谢谢你again@user1177819:很乐意帮忙。请选择对您最有帮助的答案并选中复选框以接受它。如果您不确定选择哪一个,E4F4的答案比我的答案早一点,他或她发现了相同的潜在问题,因此您可能希望选择该问题。感谢您的帮助。它确实解决了我的问题。我的文件在一个单元格中实际为空。当我删除空值时,它就工作了。谢谢你again@user1177819:很乐意帮忙。请选择对您最有帮助的答案并选中复选框以接受它。如果你不确定选择哪一个,E4F4的答案比我的早一点,他或她发现了相同的潜在问题,所以你可能想选择那个。