Python 如何识别列中的数字并在该数字中添加特定数字_Python_Awk_Sed

Python 如何识别列中的数字并在该数字中添加特定数字

python awk sed

Python 如何识别列中的数字并在该数字中添加特定数字,python,awk,sed,Python,Awk,Sed,我有一个CASE.dat文件 # X Y Z TARGET MY DIST MY DATA -------------------------------------------------------------------------------- 1 16.136051 19.214215 26.195842 0.935901 0.528294 10305.0524

我有一个CASE.dat文件

    #         X           Y           Z       TARGET      MY DIST   MY DATA
 --------------------------------------------------------------------------------
    1   16.136051   19.214215   26.195842    0.935901     0.528294 10305.052469
    2   19.296614   20.459830   20.711839    4.033354     1.152114   258.468669
    3   21.757247   20.010601   21.609096    4.008830     1.117961   208.482335
    4   23.340579   20.230572   20.299311    0.962172     0.567720  1648.046276
    5   22.232850   19.276643   24.105109    4.028086     1.105535   116.818198
    6   20.177439   18.995924   25.744873    4.020979     1.119227   259.240957
    7   20.507640   18.422719   27.698151    0.973875     0.578381  4433.058006
    8   17.718280   19.441795   24.896309    4.052598     1.117063   399.224573
    9   17.274647   20.170761   22.411821    4.049756     1.067280   369.719958
   10   15.344147   20.532170   21.791338    0.942252     0.522218  2903.487129
   11   16.747362   21.490591   16.828061    4.119692     1.052854   640.628897
   12   18.942734   21.191117   18.059497    4.016967     1.013168   370.875172
   13   16.713317   22.043861   14.846116    0.952206     0.572128 15824.211118
   14   14.917097   21.194983   17.726730    0.996560     0.573948  8439.378683
   15   20.697846   21.496657   17.007974    0.931434     0.494488  4811.530560
   16   24.891192   18.784856   25.017254    4.004345     1.086042    87.628933
   17   24.849590   17.270757   26.442292    0.986123     0.548764  2084.437203
   18   26.020588   18.043376   23.429171    0.962405     0.489209  5797.201598
   19   29.699839   22.572565   28.810307    4.025628     1.079363   339.526719
   20   31.243469   22.179022   30.120360    0.974974     0.569833  5998.952157
   21   29.172195   25.093904   28.162412    3.991001     1.124966   301.999963

我的目标是对第5列进行一些处理

我使用下面的脚本提取它

cat CASE.dat | awk '{print $5}' | awk NF | awk 'NR>1'

这给了我

现在我需要一个建议，可以改善我的上述脚本。此外，我这里有两种类型的数字，一种是

~4

，另一种是

~1

。我想将

2.0

添加到所有

~4

的数字中，并将

1.0

添加到所有

~1

的数字中。请给出任何简单的答案

直到这个结果应该是

最后，我想从6中减去

~6

（这个数字在另一个文件中可能不同），从2中减去

~1

（这个数字在另一个文件中可能不同）。最终数据应为：

您可以使用此

awk

：

awk-vd='0.009''NR给你：
import math
import numpy as np

with open("CASE.dat", "r") as msg:
    data = msg.readlines()

for i, line in enumerate(data[2:]):
   row = list(map(float, line.strip().split()))

   if round(row[4]) == 1:
       val = 1
   elif round(row[4]) == 4:
       val = 2

   row[4] = row[4] + val

   if round(row[4]) == 6:
       row[4] = 6 - row[4]
   elif round(row[4]) == 2:
       row[4] =  np.abs(row[4] - 2)

   
   data[i+2] = " ".join(map(str,row))

for row in data:
    print (row)

你会得到：
    #         X           Y           Z       TARGET      MY DIST   MY DATA

 --------------------------------------------------------------------------------

1.0 16.136051 19.214215 26.195842 0.06409900000000013 0.528294 10305.052469
2.0 19.296614 20.45983 20.711839 -0.033354000000000106 1.152114 258.468669
3.0 21.757247 20.010601 21.609096 -0.008829999999999671 1.117961 208.482335
4.0 23.340579 20.230572 20.299311 0.03782799999999997 0.56772 1648.046276
5.0 22.23285 19.276643 24.105109 -0.028086000000000055 1.105535 116.818198
6.0 20.177439 18.995924 25.744873 -0.020978999999999637 1.119227 259.240957
7.0 20.50764 18.422719 27.698151 0.026124999999999954 0.578381 4433.058006
8.0 17.71828 19.441795 24.896309 -0.0525979999999997 1.117063 399.224573
9.0 17.274647 20.170761 22.411821 -0.049756000000000355 1.06728 369.719958
10.0 15.344147 20.53217 21.791338 0.05774800000000013 0.522218 2903.487129
11.0 16.747362 21.490591 16.828061 -0.11969199999999969 1.052854 640.628897
12.0 18.942734 21.191117 18.059497 -0.016967000000000176 1.013168 370.875172
13.0 16.713317 22.043861 14.846116 0.047794000000000114 0.572128 15824.211118
14.0 14.917097 21.194983 17.72673 0.0034399999999998876 0.573948 8439.378683
15.0 20.697846 21.496657 17.007974 0.06856600000000013 0.494488 4811.53056
16.0 24.891192 18.784856 25.017254 -0.004344999999999821 1.086042 87.628933
17.0 24.84959 17.270757 26.442292 0.013876999999999917 0.548764 2084.437203
18.0 26.020588 18.043376 23.429171 0.037595000000000045 0.489209 5797.201598
19.0 29.699839 22.572565 28.810307 -0.025628000000000206 1.079363 339.526719
20.0 31.243469 22.179022 30.12036 0.025025999999999993 0.569833 5998.952157
21.0 29.172195 25.093904 28.162412 0.008999000000000201 1.124966 301.999963

谢谢@Anubhava，但你只指出了数字4。您仍然可以看到，值为3.991001的数字在接近4时不是进程。请澄清这里的贴近度定义是什么？差异应该是多少？0.005
足够好吗？我只有两种类型的数字。一个是~4，另一个是~1。这里很难给出任何定义。我的帖子中有一个错误。让我更新一下，我已经更新了。减法有个小错误。现在你看到一些数字是负数。你的结果更接近我的预期。你能稍微修改一下你的脚本吗？这样我就不需要把1
添加到接近~1的数字上了？我创建了一个标题为#的case.py脚本/usr/bin/python，但它没有给出任何输出。我得到了错误$python case.py回溯（最近一次调用）：文件“case.py”，第6行，在row=list（map（float，line.strip（）.split（））中）value错误：无法将字符串转换为float:--您使用哪种python版本？不要设置任何标题，只需执行python3 case.py即可。让我知道我同时使用了python2.7和3.6。您的整个awk调用可以简化为awk'NR>1{print$5}'CASE.dat
Perfect。所以现在我的期望是：在接近4的数字上加上2
，然后从6中减去，在接近1
的数字上加上1
，然后从2中减去。那么你的代码就毫无用处了，因为你需要$6
和$2
。试着想想如何到达那里，并说得更具体一些。对我来说，3接近4。是的，这就是我要说的。我需要把2
加到所有接近4的$5的数字中，把1
加到那些接近1
的数字中，然后把那些接近4的数字从6中减去（加上2之后，这些数字一直是~6），把那些接近1的数字从2中减去（加上1之后，它将是~2）。