Python 将df.value_计数写入新文件_Python_Pandas

Python 将df.value_计数写入新文件

python pandas

Python 将df.value_计数写入新文件,python,pandas,Python,Pandas,我有一个使用DBSCAN生成的集群标签数据帧，我正在计算集群标签的频率。我可以使用df['cluster\u labels'].value\u counts（）打印频率，但当我将其写入新文件时，我只得到簇的计数，而不是它们对应的标签。如何将其写入具有群集标签和频率的新文件？下面是截图和代码打印时：写作时：将新标题传递到文件时出错这是因为您使用的是index=False。将行中的index=False更改为index=True cluster_counts.to_csv('G:\Pro

我有一个使用DBSCAN生成的集群标签数据帧，我正在计算集群标签的频率。我可以使用

df['cluster\u labels'].value\u counts（）

打印频率，但当我将其写入新文件时，我只得到簇的计数，而不是它们对应的标签。如何将其写入具有群集标签和频率的新文件？下面是截图和代码

打印时：

写作时：

将新标题传递到文件时出错

这是因为您使用的是

index=False

。将行中的

index=False

更改为

index=True

cluster_counts.to_csv('G:\Programming Projects\GGS 681\dmv_tweets_20170309_20170314_cluster_counts.csv', index=False, header=True)

您可以在of

数据框中看到这一点。由于您在底部提到的第二个问题与主要问题无关，我建议您将其从此处删除，并在新问题中提问。它更有条理，也更有可能让你得到一个好的答案。谢谢，我将为此单独发布一个问题。太好了！它写入了两列，但标题不正确。它只写入集群标签，并将其分配给频率列。因此，我传递了一个标题字符串“column_label”和“frequency”，但它返回了一个值错误，表示写入1个cols，但得到了2个别名。我传递了count_heads=['cluster_label'，'frequency']
到cluster_counts.to_csv（'G:\Programming Projects\GGS 681\dmv_tweets\u 20170309; 20170314_cluster_counts.csv'，index=True，header=counts）
。我在原始帖子中添加了一个截图。请仔细阅读文档页面<代码>标题

应为真或假。如果为True，那么它将从数据帧中获取标题。文档中说：“boolean或list of string，default True”，因此我尝试传递标题列表。这不一样吗？您还可以传递列名。但如果df只有一列，则需要提供一个长度为1的列表。（索引不算作列）

cluster_counts.to_csv('G:\Programming Projects\GGS 681\dmv_tweets_20170309_20170314_cluster_counts.csv', index=False, header=True)