R:提取关键字后的值和行(文本文件挖掘)
设置: 我有(简单的).csv和.dat文件,这些文件是由实验室设备和其他程序创建的,用于存储有关测量或计算的信息。我在其他语言中也发现了这一点,但在R语言中也没有 问题: 使用R,我试图提取值以快速显示结果,而不打开创建的文件。在此,我有两个典型的设置: a) 我需要在已知关键字后读取先验未知值 b) 我需要在已知的关键词或行之后阅读行 我无法使scan()和grep()等函数正常工作 c) 最后,我想在一个文件夹中循环几十个文件,并给我一个摘要(为了使图片完整:我将管理这部分)R:提取关键字后的值和行(文本文件挖掘),r,keyword,text-mining,R,Keyword,Text Mining,设置: 我有(简单的).csv和.dat文件,这些文件是由实验室设备和其他程序创建的,用于存储有关测量或计算的信息。我在其他语言中也发现了这一点,但在R语言中也没有 问题: 使用R,我试图提取值以快速显示结果,而不打开创建的文件。在此,我有两个典型的设置: a) 我需要在已知关键字后读取先验未知值 b) 我需要在已知的关键词或行之后阅读行 我无法使scan()和grep()等函数正常工作 c) 最后,我想在一个文件夹中循环几十个文件,并给我一个摘要(为了使图片完整:我将管理这部分) 我将感谢任何
我将感谢任何形式的帮助。好的,它适用于关键值(尽管可能不是很好) 返回seaked值的字符
as.numeric(lapply(variable, gsub, patt=",", replace="."))
完成:数据必须更改为数字和“,”和“.”问题需要解决
排成一行:
数据=as.numeric(lappy(ks[grep(“ks_Boden”,ks)+2],gsub,patt=“,”,replace=“.”)
持之以恒不是坏事;-)
剩下的部分还没有完成,我会在完成后发布。你用
grep
和scan
做了哪些不起作用的尝试(grepl
在这里可能是更好的选择)?好的,它适用于键值(尽管可能不是很好)variable很抱歉长字符串^。-如果我理解正确,您已经解决了自己的问题。您可以添加您的回复作为答案并接受它,以便未来的搜索者可以从您的努力中获益;-)谢谢你的提醒,我是新来的,所以我必须等8个小时才能这么做;-)
variable[grep("keyword", ks)+2] # + 2 as the actual value is stored two places ahead
as.numeric(lapply(variable, gsub, patt=",", replace="."))