Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/r/77.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
如何将一组Unicode.txt转换为ANSI以便在R中进行文本分析_R_Text_Encoding_Analysis - Fatal编程技术网

如何将一组Unicode.txt转换为ANSI以便在R中进行文本分析

如何将一组Unicode.txt转换为ANSI以便在R中进行文本分析,r,text,encoding,analysis,R,Text,Encoding,Analysis,我正在Windows10x64上使用R。我正在尝试将一组txt文件读入R以进行文本分析。我正在使用以下代码: setwd(inputdir) files <- DirSource(directory = inputdir, encoding ="UTF-8" ) docs<- VCorpus(x=files) writeLines(as.character(docs[[2]])) setwd(inputdir) 文件获取所有txt文件 files <- list.files(

我正在Windows10x64上使用R。我正在尝试将一组txt文件读入R以进行文本分析。我正在使用以下代码:

setwd(inputdir)
files <- DirSource(directory = inputdir, encoding ="UTF-8" )
docs<- VCorpus(x=files)
writeLines(as.character(docs[[2]]))
setwd(inputdir)
文件获取所有txt文件

files <- list.files(path=getwd(), pattern="*.txt", full.names=T, recursive=FALSE)

文件您可以尝试
iconv
(请参见此处:)并将其循环到所有txt文件(如此处:)@mischva11谢谢!我尝试了这个代码
lapply(文件,写线(iconv(读线(文件),from=“UTF8”,to=“ANSI_X3.4-1986”)
,我在读线(文件)中得到了这个错误
错误:'con'不是一个连接。我做错了什么?似乎lappy函数没有给出正确的文件参数。我用for循环试过了,效果很好。另外,我不确定为什么我必须将for循环拆分为单个步骤,但是当我尝试使用嵌套函数时,它会删除txt文件中的数据,我会将for循环作为答案,因为它不适合用于注释部分谢谢你的建议。我用
from=“UTF8”,to=“ASCII”
尝试了循环,循环没有出现错误,但当我运行
doc时,我认为这是一个与之前提出的问题不同的问题。我不知道tm软件包与源的概念很好。您可以尝试搜索解决方案(我第一次发现,请使用相同的错误消息尝试一些问题),如果您没有找到什么,我建议您使用可复制的数据打开一个新问题。感谢您的帮助,Mishva11。
for(i in 1:length(files)){
  input <- readLines(files[i])
  converted_input <- iconv(input, from = file_encoding, to = file_encoding)
  writeLines(converted_input,files[i])
}