Python 导出到二维列表到CSV,并带有特定索引,如
目前,我可以使用熊猫创建列并将列表导出为列。例:Python 导出到二维列表到CSV,并带有特定索引,如,python,list,pandas,csv,output,Python,List,Pandas,Csv,Output,目前,我可以使用熊猫创建列并将列表导出为列。例: newRatiosDF = pd.DataFrame(newRatios) entityidC = pd.DataFrame(X['entity_id']) final = pd.concat([entityidC['entity_id'],newRatiosDF]) newRatiosDF.to_csv('../venv/output/letsseeit.csv') 输出如下所示: entity_id Ratios 0
newRatiosDF = pd.DataFrame(newRatios)
entityidC = pd.DataFrame(X['entity_id'])
final = pd.concat([entityidC['entity_id'],newRatiosDF])
newRatiosDF.to_csv('../venv/output/letsseeit.csv')
输出如下所示:
entity_id Ratios
0 3000 5
1 3001 7
...
500 3099 2
然而,这不是我想要输出代码的方式。我更希望索引是实体ID,所以我在一列和一行中有索引,然后这些索引引用每个框中的比率
我正在寻找的Ex:
3000 3001 ... 3099
3000 nan 7 12
3001 4 nan 6
...
3099 2 8 nan
我之所以有NaN,是因为我不想找到相同事物之间的比率。如果有人有任何关于如何使用pandas(或其他库)编写代码的例子,我们将不胜感激。我的比率已经在一个2D数组中,所以我需要做的就是找出如何使索引成为实体ID,然后将比率放在正确的位置
您可以假设实体_id已经有序,并且它们与相应的比率值匹配。我所要寻找的就是如何操纵熊猫(或另一个库)来做到这一点
如果您对我的代码有任何疑问,请让我知道,我会尽我所能快速回答,非常感谢您的帮助
编辑1
我通过以下方式构建阵列:
newRatios = np.zeros((xdfSize,xdfSize))
for ep in XDF['EmailPrefix']:
for ep2 in XDF['EmailPrefix']:
if rows <= xdfSize:
if columns != rows:
newRatios[columns,rows] = fuzz.token_sort_ratio(ep,ep2)
else:
newRatios[columns,rows] = None
rows += 1
rows = 0
columns += 1
对不起,不清楚你想从这里得到什么。你希望如何从两列中得到这个共现矩阵?“我的比率已经在2D数组中了”-你能展示一些这方面的样本行吗?@spghttCd请看前面的编辑1。@coldspeed我不确定你问的是什么。我只是好奇如何将实体ID设置为x和y方向的索引,然后将比率基本上放在它们与x和y的位置上。@coldspeed(我也是)的问题是:您的表“Output look”表明,每个实体ID有一个比率,否则这样的单个列表就没有任何意义了。但您的表“Ex of what Is looking”描述了比率,这取决于两个实体ID的组合。所以现在的问题是:这两者如何结合?你如何想象从第一个过渡到后一个?
[[0. 1. 1. ... 1. 1. 1.]
[1. 0. 1. ... 1. 1. 1.]
[1. 1. 0. ... 1. 1. 1.]
...
[1. 1. 1. ... 0. 1. 1.]
[1. 1. 1. ... 1. 0. 1.]
[1. 1. 1. ... 1. 1. 0.]]