R 如何解析这个编码的tsv

R 如何解析这个编码的tsv,r,csv,tidyverse,readr,R,Csv,Tidyverse,Readr,我试图使用reader::read_tsv解析这个tsv文件,但我一直收到解析失败的错误消息。然后我意识到tsv包含一些不寻常的字符,当我使用python读取文件时,它说encoding='cp1252' 我试过使用这些: writeLines(iconv(readLines("Evaluations (1).tab"), from = "cp1252", to = "UTF8"), file("test2.tab"

我试图使用
reader::read_tsv
解析这个tsv文件,但我一直收到解析失败的错误消息。然后我意识到tsv包含一些不寻常的字符,当我使用python读取文件时,它说
encoding='cp1252'

我试过使用这些:

writeLines(iconv(readLines("Evaluations (1).tab"), from = "cp1252", to = "UTF8"), file("test2.tab", encoding="UTF-8"))

read.delim("Evaluations (1).tab", sep = "\t", encoding = "Windows-1252")

read.table("Evaluations (1).tab", header=TRUE, sep="\t", fileEncoding="CP1252")
没有一个奏效

有人能看看这个并指导我如何解析它吗


谢谢

它似乎是UCS-2LE编码的,所以请尝试:

read.table(file = "Evaluations (1).tab", sep = "\t", header = TRUE, fileEncoding = "UCS-2LE")

[1] Session.Date                 Date.Completed               Evaluator.Name               Evaluator.Status             Subject.Name                
 [6] Subject.Rotation             Overall.Comments             Subject.Comments             X.Question.1.ID.             X.Question.1.Tags.          
[11] X.Question.1.Response.       X.Question.1.Comment.        X.Question.1.Drop.Down.List. X.Question.2.ID.             X.Question.2.Tags.          
[16] X.Question.2.Response.       X.Question.2.Comment.        X.Question.2.Drop.Down.List. X.Question.3.ID.             X.Question.3.Tags.          
[21] X.Question.3.Response.       X.Question.3.Comment.        X.Question.3.Drop.Down.List. X.Question.4.ID.             X.Question.4.Tags.          
[26] X.Question.4.Response.       X.Question.4.Comment.        X.Question.4.Drop.Down.List. X.Question.5.ID.             X.Question.5.Tags.          
[31] X.Question.5.Response.       X.Question.5.Comment.        X.Question.5.Drop.Down.List. X.Question.6.ID.             X.Question.6.Tags.          
[36] X.Question.6.Response.       X.Question.6.Comment.        X.Question.6.Drop.Down.List. X.Question.7.ID.             X.Question.7.Tags.          
[41] X.Question.7.Response.       X.Question.7.Comment.        X.Question.7.Drop.Down.List.
<0 rows> (or 0-length row.names)
read.table(file=“Evaluations(1).tab”,sep=“\t”,header=TRUE,fileEncoding=“UCS-2LE”)
[1] 会话.日期.已完成的计算器.名称计算器.状态主体.名称
[6] 主题。整体轮换。评论主题。评论X.Question.1.ID。十、问题1、标签。
[11] 十、问题1、答复。问题1.评论。问题1.下拉列表。十、问题2.ID。十、问题2、标签。
[16] 十、问题2、答复。十、问题2、评论。问题2.下拉列表。十、问题3.ID。十、问题3、标签。
[21]X.问题3.答复。十、问题3、评论。问题3.下拉列表。十、问题4.ID。十、问题4、标签。
[26]X.问题4.答复。十、问题4、评论。问题4.下拉列表。十、问题5.ID。十、问题5、标签。
[31]X.问题5.答复。十、问题5、评论。问题5.下拉列表。十、问题6.ID。十、问题6、标签。
[36]X.问题6.答复。十、问题6、评论。问题6.下拉列表。十、问题7.ID。十、问题7、标签。
[41]X.问题7.答复。十、问题7、评论。问题7.下拉列表。
(或长度为0的行名称)

太好了。谢谢那确实有效。你知道readr是否有类似的功能吗?我认为readr不支持多字节编码,所以除非你重新编码文件,否则你需要使用基本R。好的,谢谢你指出这一点。您还可以包括如何找出文件使用的文件编码吗?我也发现这很有帮助,只是分享给其他人()