C# 大型无向图的高效存储、查找和操作
我有一个无向图G,有大约5000个节点。任何一对节点都可以通过一条边连接。边的长度、方向或其他特征是不相关的,并且两点之间最多可以有一条边,因此节点之间的关系是二进制的。因此,总共有12497500个潜在边缘 每个节点都由字符串名称标识,而不是数字 我想存储这样一个图(作为输入数据加载到我的程序中),但我不确定哪种数据结构是最好的C# 大型无向图的高效存储、查找和操作,c#,performance,data-structures,graph,hashset,C#,Performance,Data Structures,Graph,Hashset,我有一个无向图G,有大约5000个节点。任何一对节点都可以通过一条边连接。边的长度、方向或其他特征是不相关的,并且两点之间最多可以有一条边,因此节点之间的关系是二进制的。因此,总共有12497500个潜在边缘 每个节点都由字符串名称标识,而不是数字 我想存储这样一个图(作为输入数据加载到我的程序中),但我不确定哪种数据结构是最好的 我需要多次查找给定的一对节点是否连接,因此查找性能可能是主要关注点 添加和删除元素的性能成本并不重要 如果可能的话,我还希望语法保持简单和优雅,以减少引入bug的可
- 我需要多次查找给定的一对节点是否连接,因此查找性能可能是主要关注点李>
- 添加和删除元素的性能成本并不重要李>
- 如果可能的话,我还希望语法保持简单和优雅,以减少引入bug的可能性,并使调试更容易
和一个bool[numNodes,numNodes]
将每个节点名称与索引匹配。优点:简单、快速的查找。缺点:无法轻松删除或添加节点(必须添加/删除行/列),冗余(必须小心字典
vsg[n1,n2]
),语法笨拙,因为我每次都要查看HashMapg[n2,n1]
。优点:直观,节点由字符串直接标识,易于“添加/删除节点”,因为只存储边,节点本身是隐式的。缺点:可能输入垃圾输入(由于集合有三个成员,“连接”三个节点的边)HashSet
bool
数组占用更多内存吗HashSet
成为成员?(ie正在使用outerSets.Contains(新的HashSet{“node1”、“node2”})
进行查询,实际工作了吗?)bool
数组花费更长的时间C5集合库中有一些关于图形的有用信息 这个问题看起来也很有用
SortedDictionary在引擎盖下,是一棵高度平衡的红黑树,因此查找是O(logn)。我很好奇在生成表示哈希表中边缘的键时使用字符串连接而不是元组,以便接近O(1)查找性能。这里有两种处理无向边要求的可能性:
interface-IEdgeCollection
{
布尔加法(字符串节点1、字符串节点2);
bool包含sedge(字符串节点1、字符串节点2);
布尔删除边缘(字符串节点1、字符串节点2);
}
类EdgeSet1:IEdgeCollection
{
私有HashSet_edges=新HashSet();
私有静态字符串MakeEdgeKey(字符串节点1、字符串节点2)
{
返回StringComparer.Ordinal.Compare(node1,node2)<0?node1+node2:node2+node1;
}
公共布尔加法(字符串节点1、字符串节点2)
{
var key=MakeEdgeKey(节点1、节点2);
返回_边。添加(键);
}
公共布尔包含sedge(字符串节点1、字符串节点2)
{
var key=MakeEdgeKey(节点1、节点2);
返回_edges.Contains(键);
}
公共布尔删除(字符串节点1、字符串节点2)
{
var key=MakeEdgeKey(节点1、节点2);
返回边缘。移除(键);
}
}
类EdgeSet2:IEdgeCollection
{
私有HashSet_edges=新HashSet();
私有静态元组MakeEdgeKey(字符串节点1、字符串节点2)
{
返回StringComparer.Ordinal.Compare(节点1、节点2)<0
?新元组(节点1、节点2)
:新元组(node2,node1);
}
公共布尔加法(字符串节点1、字符串节点2)
{
var key=MakeEdgeKey(节点1、节点2);
返回_边。添加(键);
}
公共布尔包含sedge(字符串节点1、字符串节点2)
{
var key=MakeEdgeKey(节点1、节点2);
返回_edges.Contains(键);
}
公共布尔删除(字符串节点1、字符串节点2)
{
var key=MakeEdgeKey(节点1、节点2);
返回边缘。移除(键);
}
}
类边集合3:IEdgeCollection
{
私有HashSet_edges=新HashSet();
私有静态元组MakeEdgeKey(字符串节点1、字符串节点2)
{
返回新元组(node1、node2);
}
公共布尔加法(字符串节点1、字符串节点2)
{
var key1=MakeEdgeKey(节点1、节点2);
var key2=MakeEdgeKey(节点2,节点1);
返回边。添加(键1)和边。添加(键2)
interface IEdgeCollection
{
bool AddEdge(string node1, string node2);
bool ContainsEdge(string node1, string node2);
bool RemoveEdge(string node1, string node2);
}
class EdgeSet1 : IEdgeCollection
{
private HashSet<string> _edges = new HashSet<string>();
private static string MakeEdgeKey(string node1, string node2)
{
return StringComparer.Ordinal.Compare(node1, node2) < 0 ? node1 + node2 : node2 + node1;
}
public bool AddEdge(string node1, string node2)
{
var key = MakeEdgeKey(node1, node2);
return _edges.Add(key);
}
public bool ContainsEdge(string node1, string node2)
{
var key = MakeEdgeKey(node1, node2);
return _edges.Contains(key);
}
public bool RemoveEdge(string node1, string node2)
{
var key = MakeEdgeKey(node1, node2);
return _edges.Remove(key);
}
}
class EdgeSet2 : IEdgeCollection
{
private HashSet<Tuple<string, string>> _edges = new HashSet<Tuple<string, string>>();
private static Tuple<string, string> MakeEdgeKey(string node1, string node2)
{
return StringComparer.Ordinal.Compare(node1, node2) < 0
? new Tuple<string, string>(node1, node2)
: new Tuple<string, string>(node2, node1);
}
public bool AddEdge(string node1, string node2)
{
var key = MakeEdgeKey(node1, node2);
return _edges.Add(key);
}
public bool ContainsEdge(string node1, string node2)
{
var key = MakeEdgeKey(node1, node2);
return _edges.Contains(key);
}
public bool RemoveEdge(string node1, string node2)
{
var key = MakeEdgeKey(node1, node2);
return _edges.Remove(key);
}
}
class EdgeSet3 : IEdgeCollection
{
private HashSet<Tuple<string, string>> _edges = new HashSet<Tuple<string, string>>();
private static Tuple<string, string> MakeEdgeKey(string node1, string node2)
{
return new Tuple<string, string>(node1, node2);
}
public bool AddEdge(string node1, string node2)
{
var key1 = MakeEdgeKey(node1, node2);
var key2 = MakeEdgeKey(node2, node1);
return _edges.Add(key1) && _edges.Add(key2);
}
public bool ContainsEdge(string node1, string node2)
{
var key = MakeEdgeKey(node1, node2);
return _edges.Contains(key);
}
public bool RemoveEdge(string node1, string node2)
{
var key1 = MakeEdgeKey(node1, node2);
var key2 = MakeEdgeKey(node2, node1);
return _edges.Remove(key1) && _edges.Remove(key2);
}
}
class Program
{
static void Test(string[] nodes, IEdgeCollection edges, int edgeCount)
{
// use edgeCount as seed to rng to ensure test reproducibility
var rng = new Random(edgeCount);
// store known edges in a separate data structure for validation
var edgeList = new List<Tuple<string, string>>();
Stopwatch stopwatch = new Stopwatch();
// randomly generated edges
stopwatch.Start();
for (int i = 0; i < edgeCount; i++)
{
string node1 = nodes[rng.Next(nodes.Length)];
string node2 = nodes[rng.Next(nodes.Length)];
edges.AddEdge(node1, node2);
edgeList.Add(new Tuple<string, string>(node1, node2));
}
var addElapsed = stopwatch.Elapsed;
// non random lookups
int nonRandomFound = 0;
stopwatch.Start();
foreach (var edge in edgeList)
{
if (edges.ContainsEdge(edge.Item1, edge.Item2))
nonRandomFound++;
}
var nonRandomLookupElapsed = stopwatch.Elapsed;
if (nonRandomFound != edgeList.Count)
{
Console.WriteLine("The edge collection {0} is not working right!", edges.GetType().FullName);
return;
}
// random lookups
int randomFound = 0;
stopwatch.Start();
for (int i = 0; i < edgeCount; i++)
{
string node1 = nodes[rng.Next(nodes.Length)];
string node2 = nodes[rng.Next(nodes.Length)];
if (edges.ContainsEdge(node1, node2))
randomFound++;
}
var randomLookupElapsed = stopwatch.Elapsed;
// remove all
stopwatch.Start();
foreach (var edge in edgeList)
{
edges.RemoveEdge(edge.Item1, edge.Item2);
}
var removeElapsed = stopwatch.Elapsed;
Console.WriteLine("Test: {0} with {1} edges: {2}s addition, {3}s non-random lookup, {4}s random lookup, {5}s removal",
edges.GetType().FullName,
edgeCount,
addElapsed.TotalSeconds,
nonRandomLookupElapsed.TotalSeconds,
randomLookupElapsed.TotalSeconds,
removeElapsed.TotalSeconds);
}
static void Main(string[] args)
{
var rng = new Random();
var nodes = new string[5000];
for (int i = 0; i < nodes.Length; i++)
{
StringBuilder name = new StringBuilder();
int length = rng.Next(7, 15);
for (int j = 0; j < length; j++)
{
name.Append((char) rng.Next(32, 127));
}
nodes[i] = name.ToString();
}
IEdgeCollection edges1 = new EdgeSet1();
IEdgeCollection edges2 = new EdgeSet2();
IEdgeCollection edges3 = new EdgeSet3();
Test(nodes, edges1, 2000000);
Test(nodes, edges2, 2000000);
Test(nodes, edges3, 2000000);
Console.ReadLine();
}
}