Python 计算movielens数据集的特征值

Python 计算movielens数据集的特征值,python,numpy,eigenvalue,Python,Numpy,Eigenvalue,我有一个数据集,我想使用算法进行降维,首先计算数据集的便利矩阵,然后计算数据集的特征值,但是;这里是我打印结果时的问题,我不知道哪个特征值属于哪个电影,我使用numpy计算特征值。 这是我的密码 #Load movie names and movie ratings movies = pd.read_csv('movies.csv') ratings = pd.read_csv('ratings.csv') ratings.drop(['timestamp'], axis=1, inplace=

我有一个数据集,我想使用算法进行降维,首先计算数据集的便利矩阵,然后计算数据集的特征值,但是;这里是我打印结果时的问题,我不知道哪个特征值属于哪个电影,我使用numpy计算特征值。
这是我的密码

#Load movie names and movie ratings
movies = pd.read_csv('movies.csv')
ratings = pd.read_csv('ratings.csv')
ratings.drop(['timestamp'], axis=1, inplace=True)
def replace_name(x):
    return movies[movies['movieId']==x].title.values[0]
ratings.movieId = ratings.movieId.map(replace_name)
M = ratings.pivot_table(index=['userId'], columns=['movieId'], values='rating')
m = M.shape
df1 = M.replace(np.nan, 0, regex=True) 
#Perform eigendecomposition on covariance matrix
cov_mat = np.cov(X_std.T)
eig_vals, eig_vecs = np.linalg.eig(cov_mat)
print('\nEigenvalues \n%s' %eig_vals)

我的代码生成的特征值数量等于电影数量,但我不知道哪个特征值属于哪个电影?

特征值不属于矩阵中的特定行或列,但对于特征向量,正如我所知,在pca算法中,我们计算每个特征的特征值和对流系数,这里是我的电影。特征值和特征向量不是单独计算的,而是作为一个整体计算的。特征向量是特征的组合,或者特征空间中的方向。那么我应该如何在这个数据集上应用主成分分析来减少电影,也许你可以解释你最终想要做什么。通常,在需要预测多个专家的标签的情况下,使用PCA。如果数据集有许多要素,则可以使用它来决定要拾取哪些要素。我看不到很多特征,只看到电影名称和相应的评级。特征值不属于矩阵中的特定行或列,但对于特征向量,正如我所知,在pca算法中,我们计算每个特征的特征值和对流系数,这里是我的电影。特征值和特征向量不是单独计算的,而是作为一个整体计算的。特征向量是特征的组合,或者特征空间中的方向。那么我应该如何在这个数据集上应用主成分分析来减少电影,也许你可以解释你最终想要做什么。通常,在需要预测多个专家的标签的情况下,使用PCA。如果数据集有许多要素,则可以使用它来决定要拾取哪些要素。就你的情况而言,我看不到太多的功能,只看到电影名称和相应的评级。