Python 将csv数据目录转换为word2vec对象

Python 将csv数据目录转换为word2vec对象,python,scikit-learn,data-visualization,word2vec,Python,Scikit Learn,Data Visualization,Word2vec,我找到了一个,但我想将其转换为word2vec(特别是曲目标题和艺术家名称),并在t-SNE中显示向量。我发现将word2vec结果保存到csv是很常见的,但是是否可以将csv文件转换为word2vec对象?将WordVector保存到csv是不常见的 而且,您链接的文件不是典型的密集高维单词向量嵌入数据 相反,Spotify的分析中有一些命名的、有意义的标量值。(我看到的东西有舞蹈性,能量,语言性,等等。) 实际的word2vec模型通常不会用如此容易解释的名称来标记值 对于聚类/绘图来说,这

我找到了一个,但我想将其转换为word2vec(特别是曲目标题和艺术家名称),并在t-SNE中显示向量。我发现将word2vec结果保存到csv是很常见的,但是是否可以将csv文件转换为word2vec对象?

将WordVector保存到csv是不常见的

而且,您链接的文件不是典型的密集高维单词向量嵌入数据

相反,Spotify的分析中有一些命名的、有意义的标量值。(我看到的东西有
舞蹈性
能量
语言性
,等等。)

实际的word2vec模型通常不会用如此容易解释的名称来标记值

对于聚类/绘图来说,这可能仍然是有趣的多维数据,但您无论如何都不会将其转换为“word2vec对象”来实现这一点

(而且,如果您单独从艺术家/标题信息中训练了一些词向量,或者使用外部词向量将艺术家/标题转换为词向量维度,结果可能会令人失望——这些词可能无法很好地描述基本模式,除非是以一些非常粗糙的方式,从共享的词中可以明显看出(比如标题中有“爱”的情歌,或者标题中有“混音”的情歌更像舞蹈,等等)


处理这些数据的最终目标是什么?

将文字向量保存到CSV并不常见

而且,您链接的文件不是典型的密集高维单词向量嵌入数据

相反,Spotify的分析中有一些命名的、有意义的标量值(我看到了像
舞蹈性
能量
语言性
,等等)

实际的word2vec模型通常不会用如此容易解释的名称来标记值

对于聚类/绘图来说,这可能仍然是有趣的多维数据,但您无论如何都不会将其转换为“word2vec对象”来实现这一点

(而且,如果您单独从艺术家/标题信息中训练了一些词向量,或者使用外部词向量将艺术家/标题转换为词向量维度,结果可能会令人失望——这些词可能无法很好地描述基本模式,除非是以一些非常粗糙的方式,从共享的词中可以明显看出(比如标题中有“爱”的情歌,或者标题中有“混音”的情歌更像舞蹈,等等)

您处理这些数据的真正最终目标是什么