Python 将csv数据目录转换为word2vec对象
我找到了一个,但我想将其转换为word2vec(特别是曲目标题和艺术家名称),并在t-SNE中显示向量。我发现将word2vec结果保存到csv是很常见的,但是是否可以将csv文件转换为word2vec对象?将WordVector保存到csv是不常见的 而且,您链接的文件不是典型的密集高维单词向量嵌入数据 相反,Spotify的分析中有一些命名的、有意义的标量值。(我看到的东西有Python 将csv数据目录转换为word2vec对象,python,scikit-learn,data-visualization,word2vec,Python,Scikit Learn,Data Visualization,Word2vec,我找到了一个,但我想将其转换为word2vec(特别是曲目标题和艺术家名称),并在t-SNE中显示向量。我发现将word2vec结果保存到csv是很常见的,但是是否可以将csv文件转换为word2vec对象?将WordVector保存到csv是不常见的 而且,您链接的文件不是典型的密集高维单词向量嵌入数据 相反,Spotify的分析中有一些命名的、有意义的标量值。(我看到的东西有舞蹈性,能量,语言性,等等。) 实际的word2vec模型通常不会用如此容易解释的名称来标记值 对于聚类/绘图来说,这
舞蹈性
,能量
,语言性
,等等。)
实际的word2vec模型通常不会用如此容易解释的名称来标记值
对于聚类/绘图来说,这可能仍然是有趣的多维数据,但您无论如何都不会将其转换为“word2vec对象”来实现这一点
(而且,如果您单独从艺术家/标题信息中训练了一些词向量,或者使用外部词向量将艺术家/标题转换为词向量维度,结果可能会令人失望——这些词可能无法很好地描述基本模式,除非是以一些非常粗糙的方式,从共享的词中可以明显看出(比如标题中有“爱”的情歌,或者标题中有“混音”的情歌更像舞蹈,等等)
处理这些数据的最终目标是什么?将文字向量保存到CSV并不常见 而且,您链接的文件不是典型的密集高维单词向量嵌入数据 相反,Spotify的分析中有一些命名的、有意义的标量值(我看到了像
舞蹈性
,能量
,语言性
,等等)
实际的word2vec模型通常不会用如此容易解释的名称来标记值
对于聚类/绘图来说,这可能仍然是有趣的多维数据,但您无论如何都不会将其转换为“word2vec对象”来实现这一点
(而且,如果您单独从艺术家/标题信息中训练了一些词向量,或者使用外部词向量将艺术家/标题转换为词向量维度,结果可能会令人失望——这些词可能无法很好地描述基本模式,除非是以一些非常粗糙的方式,从共享的词中可以明显看出(比如标题中有“爱”的情歌,或者标题中有“混音”的情歌更像舞蹈,等等)
您处理这些数据的真正最终目标是什么