Text 使用非常独特的模式对文本文件进行二次采样并提取行

Text 使用非常独特的模式对文本文件进行二次采样并提取行,text,Text,我有一个包含大量数据的数据文件,其中90%我不需要。这里是它的一小部分 0.0000 -1.042E-4 0.1000 -1.042E-4 0.2000 -1.042E-4 0.3000 -1.042E-4 0.4000 -1.042E-4 0.5000 -1.042E-4 0.6000 -1.042E-4 0.7000 -1.042E-4 0.8000 -1.042E-4 0.9000 -1.042E-4 1.0000 -1.042E-4 1.1000 -1.042E-

我有一个包含大量数据的数据文件,其中90%我不需要。这里是它的一小部分

0.0000  -1.042E-4
0.1000  -1.042E-4
0.2000  -1.042E-4
0.3000  -1.042E-4
0.4000  -1.042E-4
0.5000  -1.042E-4
0.6000  -1.042E-4
0.7000  -1.042E-4
0.8000  -1.042E-4
0.9000  -1.042E-4
1.0000  -1.042E-4
1.1000  -1.042E-4
1.2000  -1.042E-4
1.3000  -1.042E-4
1.4000  -1.042E-4
1.5000  -1.042E-4
1.6000  -1.042E-4
1.7000  -1.042E-4
而且还继续下去。右边的一栏对我来说是最重要的。问题是我只需要左手边的整数。因此,我想将上述内容简化为:

0.0000  -1.042E-4
1.0000  -1.042E-4
2.0000  -2.032E-4

基本上我要做的是删除所有不是整数的数据值,比如1.2,1.3,等等。。。这样的事情在大范围内可能发生吗?谢谢我可以访问UNIX环境,但更喜欢Windows上的任何东西。

这里有一个快速解决方案,需要访问UNIX环境

grep -E "^[0-9]+\.0" datafile.txt > decimated.txt
说明:

  • 这将使用扩展的
    grep
  • 对于一个或多个数字
    [0-9]+
  • 在行首
    ^
  • 后跟一个句点和一个零
    \.0
  • 在文件
    datafile.txt
  • 将这些行发送到名为
    decimated.txt
    的文件,而不是打印到屏幕上

如果需要,您可以修改搜索以包括点后的所有四个零,或者在第一个数字之前考虑空格…

您使用R还是Matlab?python我们在这里需要一种语言,这将很容易。有没有小数点后百位的数值,或者总是
.0
.9
加上4个额外的零?任何语言,我都能猜出来,没有,只有.0到.9,加上4个零。非常感谢!我真的很喜欢你对命令的解释!我能问一下你是怎么学会这个的吗?上课?经验胡闹?我想更好地使用所有这些unix工具,它们在正确使用时都非常有用。再次非常感谢!很高兴这有帮助。关于学习:与使用管道将shell中的命令链接在一起的方式相同,您可以通过学习一些方便的命令来积累知识,并根据需要添加微妙之处和更多命令。动机可能来自于看到简单的工具可以完成看似复杂的事情。对我个人来说,这是建立在经验基础上的。。。此外,我们还写了一本书来教授这些技能