Python:如何在numpy数组中逐行读取?
我想知道我们能否在数组中逐行读取。例如:Python:如何在numpy数组中逐行读取?,python,arrays,numpy,Python,Arrays,Numpy,我想知道我们能否在数组中逐行读取。例如: array([[ 0.28, 0.22, 0.23, 0.27], [ 0.12, 0.29, 0.34, 0.21], [ 0.44, 0.56, 0.51, 0.65]]) 要以数组形式读取第一行以执行某些操作,然后继续执行第二行数组,请执行以下操作: array([0.28,0.22,0.23,0.27]) 产生上述数组的原因在于这两行代码: from numpy import genfromtxt
array([[ 0.28, 0.22, 0.23, 0.27],
[ 0.12, 0.29, 0.34, 0.21],
[ 0.44, 0.56, 0.51, 0.65]])
要以数组形式读取第一行以执行某些操作,然后继续执行第二行数组,请执行以下操作:
array([0.28,0.22,0.23,0.27])
产生上述数组的原因在于这两行代码:
from numpy import genfromtxt
single=genfromtxt('single.csv',delimiter=',')
single.csv
0.28, 0.22, 0.23, 0.27
0.12, 0.29, 0.34, 0.21
0.44, 0.56, 0.51, 0.65
使用readlines()
看起来像是生成列表而不是数组。在我的例子中,我使用的是csv文件。我试图逐行使用值行,而不是将它们全部使用在一起,以避免内存错误。有人能帮我吗
with open('single.csv') as single:
single=single.readlines()
给出输出:
[0.28, 0.22, 0.23, 0.27]
0.28
0.22
0.23
0.27
[0.12, 0.29, 0.34, 0.21]
0.12
0.29
0.34
0.21
[0.44, 0.56, 0.51, 0.65]
0.44
0.56
0.51
0.65
您可以使用
np.fromstring
import numpy as np
with open('single.csv') as f:
lines=f.readlines()
for line in lines:
myarray = np.fromstring(line, dtype=float, sep=',')
print(myarray)
看
而且您似乎没有阅读Python文件的经验。让我在Ipython的一个实践环节中详细介绍一个示例 创建多行文字以模拟文件
In [23]: txt="""0.28, 0.22, 0.23, 0.27
0.12, 0.29, 0.34, 0.21
0.44, 0.56, 0.51, 0.65"""
将其拆分为行以模拟readlines
In [24]: txt=txt.splitlines(True)
In [25]: txt
Out[25]:
['0.28, 0.22, 0.23, 0.27\n',
'0.12, 0.29, 0.34, 0.21\n',
'0.44, 0.56, 0.51, 0.65']
我可以用genfromtxt
将其转换为数组(您可以像这样将结果传递到readlines
到genfromtxt
)
In [26]: np.genfromtxt(txt, delimiter=',')
Out[26]:
array([[ 0.28, 0.22, 0.23, 0.27],
[ 0.12, 0.29, 0.34, 0.21],
[ 0.44, 0.56, 0.51, 0.65]])
我可以迭代这些行,去掉\n
并在“,”上拆分
In [27]: for line in txt:
print line.strip().split(',')
....:
['0.28', ' 0.22', ' 0.23', ' 0.27']
['0.12', ' 0.29', ' 0.34', ' 0.21']
['0.44', ' 0.56', ' 0.51', ' 0.65']
我可以使用列表将每个字符串转换为浮点:
In [28]: for line in txt:
print [float(x) for x in line.strip().split(',')]
....:
[0.28, 0.22, 0.23, 0.27]
[0.12, 0.29, 0.34, 0.21]
[0.44, 0.56, 0.51, 0.65]
或者通过将迭代放在另一个列表理解中,我可以得到一个数字列表:
In [29]: data=[[float(x) for x in line.strip().split(',')] for line in txt]
In [30]: data
Out[30]: [[0.28, 0.22, 0.23, 0.27], [0.12, 0.29, 0.34, 0.21], [0.44, 0.56, 0.51, 0.65]]
我可以把它变成一个数组
In [31]: np.array(data)
Out[31]:
array([[ 0.28, 0.22, 0.23, 0.27],
[ 0.12, 0.29, 0.34, 0.21],
[ 0.44, 0.56, 0.51, 0.65]])
genfromtxt
基本上就是按照这个顺序进行的——读取行、拆分行、将字符串转换为值,最后从列表中创建一个数组
有一些捷径,但我认为详细地完成这些步骤会让您受益匪浅。这是基本Python字符串和列表操作的一个练习,就像它是关于数组一样。您的
csv
是否有数组([0.28,0.22,0.23,0.27])
在其中?这不是csv
格式。readlines
生成字符串列表。解析每一行以获取数字抱歉,我不熟悉np.fromstring。它返回了以下错误:name错误:name'double'未定义hanks:)非常有用。
In [31]: np.array(data)
Out[31]:
array([[ 0.28, 0.22, 0.23, 0.27],
[ 0.12, 0.29, 0.34, 0.21],
[ 0.44, 0.56, 0.51, 0.65]])