从csv绘制Python图形

从csv绘制Python图形,python,python-2.7,csv,graphing,Python,Python 2.7,Csv,Graphing,我提取了6个月的电子邮件元数据,并将其保存为csv文件。csv现在只包含两列(发件人和收件人电子邮件地址)。我想建立一个图,其中顶点是那些与我交流的人,以及与我交流的人,边是由一个通信链接创建的,该通信链接将边标记为我进行了多少次通信。进行此操作的最佳方法是什么?一种方法是使用链接数据原则(但如果您的时间很短且没有链接数据方面的背景,则不建议这样做)。以下是一种可能的方法: 将每个实体描述为URI 使用现有的本体(如foaf)来描述数据 将数据转换为资源描述框架(RDF) 使用RDF可视化工具

我提取了6个月的电子邮件元数据,并将其保存为csv文件。csv现在只包含两列(发件人和收件人电子邮件地址)。我想建立一个图,其中顶点是那些与我交流的人,以及与我交流的人,边是由一个通信链接创建的,该通信链接将边标记为我进行了多少次通信。进行此操作的最佳方法是什么?

一种方法是使用链接数据原则(但如果您的时间很短且没有链接数据方面的背景,则不建议这样做)。以下是一种可能的方法:

  • 将每个实体描述为URI
  • 使用现有的本体(如foaf)来描述数据
  • 将数据转换为资源描述框架(RDF)
  • 使用RDF可视化工具 因为RDF本质上是一个图形,所以您将能够可视化数据并对其进行扩展


    如果您不熟悉链接数据,可以使用
    Pajek
    ()查看garphs。这种方法简单得多,但缺乏语义互操作性的好处,前提是您首先关心它们。

    Cytoscape可能能够以这种格式导入数据并从中构建网络

    您的问题(在提到Python时)并没有说您想用Python做什么或做多少。我假设Python是一个您知道的工具,但主要目标是使数据可视化。在这种情况下:

    1) 使用-有一些工具可以按原样使用CSV文件,Gephi就是其中之一。在您的情况下,需要保留边缘权重(=使用2个电子邮件地址交换的电子邮件数),这可以使用

    2) 另一个选项是预处理CSV文件(例如,使用Python),计算边缘权重(每两个电子邮件地址之间的电子邮件数量),并将其保存为您喜欢的任何格式。结果可以在网络分析工具(如Gephi)中可视化,也可以直接在Python中可视化(如使用)


    这是一个示例(尽管它们的图表没有显示权重)。

    我在这里没有看到问题。请查看此:。关于您的项目,请查看此库: