将\u tsv解析数据错误地读入R

将\u tsv解析数据错误地读入R,r,readr,R,Readr,我目前正在使用Mac操作系统,试图使用tidyverse中的read_tsv来读取下面的txt文件: igg oxygen 881 34.6 1290 45 2147 62.3 1909 58.9 1282 42.5 1530 44.3 2067 67.9 1982 58.5 1019 35.6 1651 49.6 752 33 1687 52 1782 61.4 1529 50.2 969 34.1 1660 52.

我目前正在使用Mac操作系统,试图使用
tidyverse
中的
read_tsv
来读取下面的
txt
文件:

igg oxygen
881 34.6
1290    45
2147    62.3
1909    58.9
1282    42.5
1530    44.3
2067    67.9
1982    58.5
1019    35.6
1651    49.6
752 33
1687    52
1782    61.4
1529    50.2
969 34.1
1660    52.5
2121    69.9
1382    38.8
1714    50.6
1959    69.4
1158    37.4
965 35.1
1456    43
1273    44.1
1418    49.8
1743    54.4
1997    68.5
2177    69.5
1965    63
1264    43.2
但是,当我尝试在中读取文件时,会遇到以下问题:

exerimmun <- read_tsv(file = "./exerimmun.txt")

── Column specification ──────────────────────────────────────────────────────────────────────────────────────────────
cols(
  i = col_logical(),
  col_logical()
)

Warning: 124 parsing failures.
row col           expected    actual                                        file
  1  i  1/0/T/F/TRUE/FALSE                                     './exerimmun.txt'
  1  -- 2 columns          1 columns                           './exerimmun.txt'
  2  i  1/0/T/F/TRUE/FALSE                                     './exerimmun.txt'
  2     1/0/T/F/TRUE/FALSE                                     './exerimmun.txt'
  3  i  1/0/T/F/TRUE/FALSE                                     './exerimmun.txt'
... ... .................. ......... ...........................................
See problems(...) for more details.
对我来说,这应该很好,因为数据只有两列。在阅读了有关如何读入
txt
文件的文档后,我不确定自己遗漏了什么

编辑:我尝试了
read.table(“./exerimun.txt”)
并获得以下结果:

Error in type.convert.default(data[[i]], as.is = as.is[i], dec = dec,  : 
  invalid multibyte string at '<ff><fe>i'
In addition: Warning messages:
1: In read.table(file = "./exerimmun.txt") :
  line 1 appears to contain embedded nulls
2: In read.table(file = "./exerimmun.txt") :
  line 2 appears to contain embedded nulls
3: In read.table(file = "./exerimmun.txt") :
  line 3 appears to contain embedded nulls
4: In read.table(file = "./exerimmun.txt") :
  line 4 appears to contain embedded nulls
5: In read.table(file = "./exerimmun.txt") :
  line 5 appears to contain embedded nulls
6: In scan(file = file, what = what, sep = sep, quote = quote, dec = dec,  :
  embedded nul(s) found in input
type.convert.default(数据[[i]],as.is=as.is[i],dec=dec,
错误:
“i”处的多字节字符串无效
此外:警告信息:
1:在read.table(file=“./exerimun.txt”)中:
第1行似乎包含嵌入的空值
2:在read.table(file=“./exerimun.txt”)中:
第2行似乎包含嵌入的空值
3:在read.table(file=“./exerimun.txt”)中:
第3行似乎包含嵌入的空值
4:在read.table(file=“./exerimun.txt”)中:
第4行似乎包含嵌入的空值
5:在read.table(file=“./exerimun.txt”)中:
第5行似乎包含嵌入的空值
6:在扫描中(file=file,what=what,sep=sep,quote=quote,dec=dec,:
在输入中找到嵌入式nul

提前感谢。

暂时避免使用该功能可能是最简单的方法?之后您可以随时转换为
tibble

在这里,我将您的数据保存为
/tmp/data.tsv
,并使用纯base R来处理它:

> x <- read.table("/tmp/data.tsv", header=TRUE)
> str(x)
'data.frame':   30 obs. of  2 variables:
 $ igg   : int  881 1290 2147 1909 1282 1530 2067 1982 1019 1651 ...
 $ oxygen: num  34.6 45 62.3 58.9 42.5 44.3 67.9 58.5 35.6 49.6 ...
> summary(x)
      igg           oxygen    
 Min.   : 752   Min.   :33.0  
 1st Qu.:1275   1st Qu.:42.6  
 Median :1590   Median :50.0  
 Mean   :1558   Mean   :50.6  
 3rd Qu.:1946   3rd Qu.:60.8  
 Max.   :2177   Max.   :69.9  
> 
>x str(x)
“data.frame”:两个变量中的30个:
$igg:int 881 1290 2147 1909 1282 1530 2067 1982 1019 1651。。。
$oxygen:num34.64562.358.942.544.367.958.535.649.6。。。
>摘要(十)
igg氧
最小值:752最小值:33.0
第一区:1275第一区:42.6
中位数:1590中位数:50.0
平均数:1558平均数:50.6
第三区:1946第三区:60.8
最大值:2177最大值:69.9
> 

暂时避免使用该功能可能是最简单的方法?之后,您始终可以转换为
TIBLE

在这里,我将您的数据保存为
/tmp/data.tsv
,并使用纯base R来处理它:

> x <- read.table("/tmp/data.tsv", header=TRUE)
> str(x)
'data.frame':   30 obs. of  2 variables:
 $ igg   : int  881 1290 2147 1909 1282 1530 2067 1982 1019 1651 ...
 $ oxygen: num  34.6 45 62.3 58.9 42.5 44.3 67.9 58.5 35.6 49.6 ...
> summary(x)
      igg           oxygen    
 Min.   : 752   Min.   :33.0  
 1st Qu.:1275   1st Qu.:42.6  
 Median :1590   Median :50.0  
 Mean   :1558   Mean   :50.6  
 3rd Qu.:1946   3rd Qu.:60.8  
 Max.   :2177   Max.   :69.9  
> 
>x str(x)
“data.frame”:两个变量中的30个:
$igg:int 881 1290 2147 1909 1282 1530 2067 1982 1019 1651。。。
$oxygen:num34.64562.358.942.544.367.958.535.649.6。。。
>摘要(十)
igg氧
最小值:752最小值:33.0
第一区:1275第一区:42.6
中位数:1590中位数:50.0
平均数:1558平均数:50.6
第三区:1946第三区:60.8
最大值:2177最大值:69.9
> 

Try
read.table(“./exerimumn.txt”)
。文件开头似乎有一个意外的(未打印的)字符,尚未复制到示例中。@Miff我从Try
read.table(“./exerimumn.txt”)
下载了数据。看起来有一个意外的(未打印的)字符文件开头的字符,尚未复制到您的示例中。@Miff我从Thank下载了数据,关于如何轻松转换为
tsv
?我在线使用了一个源代码,但不确定我的计算机上是否有更简单的方法。我试图更改文件类型,但一开始没有效果。什么您的意思是转换为tsv以另存为吗?您可以查看
帮助(write.table)
谢谢。关于如何轻松转换为
tsv
有什么建议吗?我在网上使用了一个源代码,但不确定我的计算机上是否有更简单的方法。我尝试只更改文件类型,但一开始没有效果。你说的转换为
tsv
是什么意思?另存为?你可以查看
帮助(write.table)
,谢谢。