在Python中打印仅从CSV中提取特定列

在Python中打印仅从CSV中提取特定列,python,python-3.x,csv,matplotlib,Python,Python 3.x,Csv,Matplotlib,编辑:如建议缩短问题: 对于python和编程来说,这是一个全新的概念,我想将第1列和第4列绘制成一个log(x)log(y)图。老实说,我不知道如何从中提取我需要的两列 16:58:58 | 2.090 | 26.88 | 1.2945E-9 | 45.8 16:59:00 | 2.031 | 27.00 | 1.3526E-9 | 132.1 16:59:02 | 2.039 | 26.90 | 1.3843E-9 | 178.5 16:59:04 | 2.031 | 2

编辑:如建议缩短问题:

对于python和编程来说,这是一个全新的概念,我想将第1列和第4列绘制成一个log(x)log(y)图。老实说,我不知道如何从中提取我需要的两列

16:58:58 | 2.090 | 26.88  | 1.2945E-9  |   45.8
16:59:00 | 2.031 | 27.00  | 1.3526E-9  |  132.1
16:59:02 | 2.039 | 26.90  | 1.3843E-9  |  178.5
16:59:04 | 2.031 | 26.98  | 1.4628E-9  |  228.9
16:59:06 | 2.031 | 27.04  | 1.5263E-9  |  259.8
16:59:08 | 2.027 | 26.84  | 1.6010E-9  |  271.8
使用熊猫:

import pandas as pd
df = pd.read_csv("data.txt", delimiter="\s[|]\s+", header=None, index_col=0)
df.plot(y=4)


(请注意,这忽略了对数缩放,因为不清楚时间的对数应该是什么)

如果您不想使用优秀的
熊猫
,这里有一个steam方法

import matplotlib.pyplot as plt
import math
import datetime as dt

test = """16:58:58 | 2.090 | 26.88  | 1.2945E-9  |   45.8\n
16:59:00 | 2.031 | 27.00  | 1.3526E-9  |  132.1\n
16:59:02 | 2.039 | 26.90  | 1.3843E-9  |  178.5\n
16:59:04 | 2.031 | 26.98  | 1.4628E-9  |  228.9\n
16:59:06 | 2.031 | 27.04  | 1.5263E-9  |  259.8\n
16:59:08 | 2.027 | 26.84  | 1.6010E-9  |  271.8\n"""

lines = [line for line in test.splitlines() if line != ""]

# Here is the real code
subset = []

for line in lines:
    parts = line.split('|')
    ts = dt.datetime.strptime(parts[0].strip(), "%H:%M:%S")
    num = math.log(float(parts[3].strip()))
    subset.append((ts, num))

# now there is a list of tuples with your datapoints, looking like
# [(datetime.datetime(1900, 1, 1, 16, 58, 58), 1.2945E-9), (datetime.datetime(1900, 1, 1, 16, 59), ...]
# I made this list intentionally so that you can see how one can gather everything in a tidy way from the
# raw string data.

# Now lets separate things for plotting
times = [elem[0] for elem in subset]
values = [elem[1] for elem in subset]

# now to plot, I'm going to use the matplotlib plot_date function.
plt.figure()
plt.plot_date(times, values)
# do some formatting on the date axis
plt.gcf().autofmt_xdate()
plt.show()

使用
pandas
库将大大简化您的生活!欢迎来到SO:请拿着这个。你应该把这两个问题分成两个独立的问题。首先,您可能希望获得正确形状的数据。那么你就要担心它的绘制了。@nbouchat现在查看它看起来很不错。@ShawnMehan不知道16点钟的对数是多少。呵呵,对不起,我没有评论时间日志,因为我觉得这是个玩笑。日志不是16点钟的,而是在[s]中将其转换为$\Delta t$,然后转换为$Log(\Delta t)$。但我想我可以完成这一步。我不确定
lines=[test.splitlines()if line!='']
不会影响您的解决方案。这是一种将测试数据块转换为模仿文件读取行的格式的机制。您只需要担心下面的
真实代码
注释。也就是说,它从
test
string生成一个行列表。