Python 在绘制共同基金的数据框架时遇到问题

Python 在绘制共同基金的数据框架时遇到问题,python,pandas,plot,cluster-analysis,Python,Pandas,Plot,Cluster Analysis,首先,这是我的数据帧: Date 2012-09-04 00:00:00 2012-09-05 00:00:00 2012-09-06 00:00:00 2012-09-07 00:00:00 2012-09-10 00:00:00 2012-09-11 00:00:00 2012-09-12 00:00:00 2012-09-13 00:00:00 2012-09-14 00:00:00 2012-09-17 00:00:00 ... 2017-08-22 00:00:00 2017-0

首先,这是我的数据帧:

Date    2012-09-04 00:00:00 2012-09-05 00:00:00 2012-09-06 00:00:00 2012-09-07 00:00:00 2012-09-10 00:00:00 2012-09-11 00:00:00 2012-09-12 00:00:00 2012-09-13 00:00:00 2012-09-14 00:00:00 2012-09-17 00:00:00 ... 2017-08-22 00:00:00 2017-08-23 00:00:00 2017-08-24 00:00:00 2017-08-25 00:00:00 2017-08-28 00:00:00 2017-08-29 00:00:00 2017-08-30 00:00:00 2017-08-31 00:00:00 2017-09-01 00:00:00 Type
AABTX   9.73    9.73    9.83    9.86    9.83    9.86    9.86    9.96    9.98    9.96    ... 11.44   11.45   11.44   11.46   11.46   11.47   11.47   11.51   11.52   Hybrid
AACTX   9.66    9.65    9.77    9.81    9.78    9.81    9.82    9.92    9.95    9.93    ... 12.32   12.32   12.31   12.33   12.34   12.34   12.35   12.40   12.41   Hybrid
AADTX   9.71    9.70    9.85    9.90    9.86    9.89    9.91    10.02   10.07   10.05   ... 13.05   13.04   13.03   13.05   13.06   13.06   13.08   13.14   13.15   Hybrid
AAETX   9.92    9.91    10.07   10.13   10.08   10.12   10.14   10.26   10.32   10.29   ... 13.84   13.84   13.82   13.85   13.86   13.86   13.89   13.96   13.98   Hybrid
AAFTX   9.85    9.84    10.01   10.06   10.01   10.05   10.07   10.20   10.26   10.23   ... 14.09   14.08   14.07   14.09   14.11   14.11   14.15   14.24   14.26   Hybrid
这有点难理解,但本质上,这些只是一些共同基金(638)的收盘价,
Type
标记在最后一列中。我想在一个单独的绘图上绘制所有这些,并有一个图例,标明每个绘图的类型

我想看看我可能需要多少潜在的集群。这是我第一次将数据可视化,但如果您有任何其他建议,请随时提出

此外,在我的第一次尝试中,我尝试:

parallel_coordinates(closing_data, 'Type', alpha=0.2, colormap=dark2_cmap)
plt.show()

它只是显示为一个黑色斑点,经过一些研究,我发现它不能很好地处理大量的功能

您可能正在寻找类似的东西,它在scikit学习机器学习库中实现。它应该允许找到最佳数量的集群来考虑您的数据。

< P>您可能正在寻找类似于在SCIKIT学习机学习库中实现的一些东西。它应该允许找到一个最佳数量的集群来考虑您的数据。

< P>我建议将数据框转置,因为时间戳更自然地作为一个索引,并且您将能够将单个时间序列作为“代码”> DF.AABTX或<代码> DF[AAABTX ] 。p> 对于数量较少的时间序列,您可以尝试使用df.plot(),但当它相当大时,您不应该惊讶于最初看到一些混乱


尝试绘制数据的子集,但请确保时间在索引中,而不是列名中

我的建议是转置数据帧,因为时间戳更自然地作为索引出现,您将能够将单个时间序列作为
df.AABTX
df['AABTX']
来处理

对于数量较少的时间序列,您可以尝试使用df.plot(),但当它相当大时,您不应该惊讶于最初看到一些混乱


尝试绘制数据的子集,但请确保时间在索引中,而不是列名中

发布相关代码更好。发布相关代码更好。