Python 用numpy.savetxt实现不同的列格式_Python_Csv_Numpy_Save

Python 用numpy.savetxt实现不同的列格式

python csv numpy

Python 用numpy.savetxt实现不同的列格式,python,csv,numpy,save,Python,Csv,Numpy,Save,我想使用numpy.savetxt创建一个.csv文件。文件的每个行都表示某个事件。每行有多个列，指示事件的不同元素。每个列中存储的信息不同。某些列将包含单个浮点值，而其他列应包含两个相互连接的浮点。如果我在加载.csv时调用该列，我应该获得两个浮点值我有以下代码： import numpy rows = 5 columns = 2 save_values = numpy.zeros((rows, columns)) for idx in xrange(rows): column_0

我想使用

numpy.savetxt

创建一个

.csv

文件。文件的每个

行

都表示某个事件。每行有多个

列

，指示事件的不同元素。每个

列中存储的信息不同。某些列
将包含单个浮点
值，而其他列应包含两个相互连接的浮点。如果我在加载.csv
时调用该列，我应该获得两个浮点值
我有以下代码：
import numpy

rows = 5
columns = 2 
save_values = numpy.zeros((rows, columns))

for idx in xrange(rows):
  column_0 = float(idx)
  column_1 = [idx + 5., idx + 15.]

  save_values[idx, :] = column_0, column_1

numpy.savetxt("outfile.csv", save_values, delimiter = ",")

但是，这会导致以下错误消息：
  save_values[idx, :] = column_0, column_1
ValueError: setting an array element with a sequence.

这是可以理解的。然而，尽管我知道为什么会出错，但我很难实现我的目标
我如何才能实现我的目标？
您甚至还没有进入savetxt
步骤
save_values[idx, :] = column_0, column_1

目标是2个值（2列）。源代码是idx和一个列表
这就是为什么它会给你“序列设置”错误。它无法将列表放入保存值[idx，1]

您可以定义一个包含2个字段的save_values
数组，其中一个字段包含2个元素。但你会怎样拯救它呢
文本文件应如何显示？3列之间用，
分隔？或第二层内具有特殊结构的两根立柱，例如
 1.2, 3.5, 4.2   # or
 1.2, [2.5, 4.2]

这反过来又引发了可以加载什么的问题genfromtxt
可以处理3列；它不能轻易地处理嵌套的列。默认情况下，genfromtxt
会将3列的大小写读取为3列，但也可以将2个字段设置为dtype

无论如何，为了节省时间，我认为生成3列是最简单的。可以使用列或字段重新加载
我可以使用以下命令生成复合数据类型数组：
In [329]: dt = np.dtype('i,(2,)f')
In [330]: dt
Out[330]: dtype([('f0', '<i4'), ('f1', '<f4', (2,))])
In [331]: save_values = np.zeros((5,),dtype=dt)
In [332]: for i in range(5):
     ...:     save_values[i]=(i,(i+5., i+15.))
     ...:     
In [333]: save_values
Out[333]: 
array([(0, [5.0, 15.0]), (1, [6.0, 16.0]), (2, [7.0, 17.0]),
       (3, [8.0, 18.0]), (4, [9.0, 19.0])], 
      dtype=[('f0', '<i4'), ('f1', '<f4', (2,))])

我可以用视图展平数组数据类型（这里我保留第一个字段整数只是为了保持有趣）：
我可以使用以下任一数据类型重新加载它：
In [342]: np.genfromtxt('test.txt',delimiter=',',dtype=dt)
Out[342]: 
array([(0, [5.0, 15.0]), (1, [6.0, 16.0]), (2, [7.0, 17.0]),
       (3, [8.0, 18.0]), (4, [9.0, 19.0])], 
      dtype=[('f0', '<i4'), ('f1', '<f4', (2,))])

In [343]: np.genfromtxt('test.txt',delimiter=',',dtype=dt1)
Out[343]: 
array([(0, 5.0, 15.0), (1, 6.0, 16.0), (2, 7.0, 17.0), (3, 8.0, 18.0),
       (4, 9.0, 19.0)], 
      dtype=[('f0', '<i4'), ('f1', '<f4'), ('f2', '<f4')])

fmt
可以拼写出来，也可以从单个字段格式构建，例如
fmt = ','.join(['%10f']*3)   # or
fmt = '%10d, %10f, %10f'

因此可以归结为标准的Python字符串格式。在numpy数组中，所有元素必须具有相同的类型，即在numpy数组中，第一列不能是数字，第二列不能是向量。为此，您需要一个pandas表。但是，您可以使用一个表，其中字段具有不同的数据类型。
In [337]: dt1=np.dtype('i,f,f')
In [338]: save_values.view(dt1)
Out[338]: 
array([(0, 5.0, 15.0), (1, 6.0, 16.0), (2, 7.0, 17.0), (3, 8.0, 18.0),
       (4, 9.0, 19.0)], 
      dtype=[('f0', '<i4'), ('f1', '<f4'), ('f2', '<f4')])

In [340]: np.savetxt('test.txt',save_values.view(dt1),fmt='%10d, %10f, %10f')
In [341]: cat test.txt
         0,   5.000000,  15.000000
         1,   6.000000,  16.000000
         2,   7.000000,  17.000000
         3,   8.000000,  18.000000
         4,   9.000000,  19.000000

In [342]: np.genfromtxt('test.txt',delimiter=',',dtype=dt)
Out[342]: 
array([(0, [5.0, 15.0]), (1, [6.0, 16.0]), (2, [7.0, 17.0]),
       (3, [8.0, 18.0]), (4, [9.0, 19.0])], 
      dtype=[('f0', '<i4'), ('f1', '<f4', (2,))])

In [343]: np.genfromtxt('test.txt',delimiter=',',dtype=dt1)
Out[343]: 
array([(0, 5.0, 15.0), (1, 6.0, 16.0), (2, 7.0, 17.0), (3, 8.0, 18.0),
       (4, 9.0, 19.0)], 
      dtype=[('f0', '<i4'), ('f1', '<f4'), ('f2', '<f4')])

for row in myarray:
   print(fmt % tuple(row))

fmt = ','.join(['%10f']*3)   # or
fmt = '%10d, %10f, %10f'