Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/286.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 从具有行和列标题的csv文件中读取networkx图形_Python_Csv_Networkx - Fatal编程技术网

Python 从具有行和列标题的csv文件中读取networkx图形

Python 从具有行和列标题的csv文件中读取networkx图形,python,csv,networkx,Python,Csv,Networkx,我有一个CSV文件,它表示图形的邻接矩阵。但是,文件的第一行是节点的标签,第一列也是节点的标签。如何将此文件读入networkxgraph对象?有没有一种整洁的蟒蛇式的方法可以不必到处乱闯 到目前为止,我的审判: x = np.loadtxt('file.mtx', delimiter='\t', dtype=np.str) row_headers = x[0,:] col_headers = x[:,0] A = x[1:, 1:] A = np.array(A, dtype='int')

我有一个CSV文件,它表示图形的邻接矩阵。但是,文件的第一行是节点的标签,第一列也是节点的标签。如何将此文件读入
networkx
graph对象?有没有一种整洁的蟒蛇式的方法可以不必到处乱闯

到目前为止,我的审判:

x = np.loadtxt('file.mtx', delimiter='\t', dtype=np.str)
row_headers = x[0,:]
col_headers = x[:,0]
A = x[1:, 1:]
A = np.array(A, dtype='int')
但这当然不能解决问题,因为我需要创建图时节点的标签

数据示例:

Attribute,A,B,C
A,0,1,1
B,1,0,0
C,1,0,0

制表符是分隔符,而不是逗号tho。

这会起作用,但不确定这是最好的方式:

In [23]:

import pandas as pd
import io
import networkx as nx
temp = """Attribute,A,B,C
A,0,1,1
B,1,0,0
C,1,0,0"""
# for your case just load the csv like you would do, use sep='\t'
df = pd.read_csv(io.StringIO(temp))
df
Out[23]:
  Attribute  A  B  C
0         A  0  1  1
1         B  1  0  0
2         C  1  0  0

In [39]:

G = nx.DiGraph()
for col in df:
    for x in list(df.loc[df[col] == 1,'Attribute']):
        G.add_edge(col,x)

G.edges()
Out[39]:
[('C', 'A'), ('B', 'A'), ('A', 'C'), ('A', 'B')]

In [40]:

nx.draw(G)

您可以将数据读入结构化数组。标签可以从
x.dtype.names
中获得,然后可以使用
nx生成networkx图形。从\u numpy\u矩阵

import numpy as np
import networkx as nx
import matplotlib.pyplot as plt

# read the first line to determine the number of columns
with open('file.mtx', 'rb') as f:
    ncols = len(next(f).split('\t'))

x = np.genfromtxt('file.mtx', delimiter='\t', dtype=None, names=True,
                  usecols=range(1,ncols) # skip the first column
                  )
labels = x.dtype.names

# y is a view of x, so it will not require much additional memory
y = x.view(dtype=('int', len(x.dtype)))

G = nx.from_numpy_matrix(y)
G = nx.relabel_nodes(G, dict(zip(range(ncols-1), labels)))

print(G.edges(data=True))
# [('A', 'C', {'weight': 1}), ('A', 'B', {'weight': 1})]
nx.from\u numpy\u矩阵
有一个
create\u using
参数,可用于指定要创建的networkx图形的类型。比如说,

G = nx.from_numpy_matrix(y, create_using=nx.DiGraph())

使
G
a
DiGraph

这样这些标签在第一行和第一列重复,所以是多余的?你可以只使用pandas,它将使用标签作为列名,然后构建图形。你可以发布一些数据吗?