Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/google-app-engine/4.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
R 转换为数据帧或保存到磁盘时保留希腊字符的编码/外观_R_Text_Encoding - Fatal编程技术网

R 转换为数据帧或保存到磁盘时保留希腊字符的编码/外观

R 转换为数据帧或保存到磁盘时保留希腊字符的编码/外观,r,text,encoding,R,Text,Encoding,我正在开发一个文本处理Rscript,它使用希腊文本。问题是我想在转换为数据帧并将其保存为csv或excel文件时保留字符 greece.letters <- c("Ήρθαν τα για να κερδίζεις κάθε μέρα!", "Καλώς ήρθατε στην επόμενη τραπεζική εμπειρία", "Τώρα, κάθε συναλλαγή με τις κάρτες της Τράπεζας Πειραιώς, μπορεί να κρύβει"

我正在开发一个文本处理Rscript,它使用希腊文本。问题是我想在转换为数据帧并将其保存为csv或excel文件时保留字符

greece.letters <- c("Ήρθαν τα για να κερδίζεις κάθε μέρα!",
"Καλώς ήρθατε στην επόμενη τραπεζική εμπειρία",
"Τώρα, κάθε συναλλαγή με τις κάρτες της Τράπεζας Πειραιώς,
 μπορεί να κρύβει","Μην αφήσετε τα τέλη κυκλοφορίας να σας τρομάξουν!")

write.csv(as.data.frame(greece.letters), newgreekfile.csv)

#
# but if you take a look everything is now unicode
#

as.data.frame(greece.letters)
    <fctr>
    <U+0389><U+03C1><U+03B8>a<U+03BD> ta <U+03B3><U+03B9>a <U+03BD>a <U+03BA>e<U+03C1>d<U+03AF><U+03B6>e<U+03B9><U+03C2> <U+03BA><U+03AC><U+03B8>e µ<U+03AD><U+03C1>a!
    <U+039A>a<U+03BB><U+03CE><U+03C2> <U+03AE><U+03C1................and so on
原始编码为:

Encoding(greece.letters)
[1] "UTF-8" "UTF-8" "UTF-8" "UTF-8"    

您使用的是什么操作系统和语言环境?如果只打印列向量,它看起来正常吗<代码>as.data.frame(希腊字母)[,1]?数据的原始编码是什么?windows 7,语言环境ES。打印列向量看起来不错。原始编码[1]“UTF-8”UTF-8“UTF-8”UTF-8“UTF-8”我从您的示例中看不出
write.csv
是如何导致问题的。我认为data.frames的
print()
代码只是执行unicode转义,以尝试使列像up一样。应保留列中的数据。当您试图打印整个数据框时,您应该只看到
内容,但这只是屏幕的格式化方式,而不是“真正的”内容。问题是输出CSV要在整个组织中共享,不能提供他们称之为“胡言乱语”的数据
Encoding(greece.letters)
[1] "UTF-8" "UTF-8" "UTF-8" "UTF-8"