Python 将df.value_计数写入新文件

Python 将df.value_计数写入新文件,python,pandas,Python,Pandas,我有一个使用DBSCAN生成的集群标签数据帧,我正在计算集群标签的频率。我可以使用df['cluster\u labels'].value\u counts()打印频率,但当我将其写入新文件时,我只得到簇的计数,而不是它们对应的标签。如何将其写入具有群集标签和频率的新文件?下面是截图和代码 打印时: 写作时: 将新标题传递到文件时出错 这是因为您使用的是index=False。将行中的index=False更改为index=True cluster_counts.to_csv('G:\Pro

我有一个使用DBSCAN生成的集群标签数据帧,我正在计算集群标签的频率。我可以使用
df['cluster\u labels'].value\u counts()
打印频率,但当我将其写入新文件时,我只得到簇的计数,而不是它们对应的标签。如何将其写入具有群集标签和频率的新文件?下面是截图和代码

打印时

写作时:

将新标题传递到文件时出错


这是因为您使用的是
index=False
。将行中的
index=False
更改为
index=True

cluster_counts.to_csv('G:\Programming Projects\GGS 681\dmv_tweets_20170309_20170314_cluster_counts.csv', index=False, header=True)

您可以在of
数据框中看到这一点。由于您在底部提到的第二个问题与主要问题无关,我建议您将其从此处删除,并在新问题中提问。它更有条理,也更有可能让你得到一个好的答案。谢谢,我将为此单独发布一个问题。太好了!它写入了两列,但标题不正确。它只写入集群标签,并将其分配给频率列。因此,我传递了一个标题字符串“column_label”和“frequency”,但它返回了一个值错误,表示写入1个cols,但得到了2个别名。我传递了
count_heads=['cluster_label','frequency']
cluster_counts.to_csv('G:\Programming Projects\GGS 681\dmv_tweets\u 20170309; 20170314_cluster_counts.csv',index=True,header=counts)
。我在原始帖子中添加了一个截图。请仔细阅读文档页面<代码>标题
应为真或假。如果为True,那么它将从数据帧中获取标题。文档中说:“boolean或list of string,default True”,因此我尝试传递标题列表。这不一样吗?您还可以传递列名。但如果df只有一列,则需要提供一个长度为1的列表。(索引不算作列)
cluster_counts.to_csv('G:\Programming Projects\GGS 681\dmv_tweets_20170309_20170314_cluster_counts.csv', index=False, header=True)