Python 计算movielens数据集的特征值_Python_Numpy_Eigenvalue

Python 计算movielens数据集的特征值

python numpy

Python 计算movielens数据集的特征值,python,numpy,eigenvalue,Python,Numpy,Eigenvalue,我有一个数据集，我想使用算法进行降维，首先计算数据集的便利矩阵，然后计算数据集的特征值，但是；这里是我打印结果时的问题，我不知道哪个特征值属于哪个电影，我使用numpy计算特征值。这是我的密码 #Load movie names and movie ratings movies = pd.read_csv('movies.csv') ratings = pd.read_csv('ratings.csv') ratings.drop(['timestamp'], axis=1, inplace=

我有一个数据集，我想使用算法进行降维，首先计算数据集的便利矩阵，然后计算数据集的特征值，但是；这里是我打印结果时的问题，我不知道哪个特征值属于哪个电影，我使用numpy计算特征值。
这是我的密码

#Load movie names and movie ratings
movies = pd.read_csv('movies.csv')
ratings = pd.read_csv('ratings.csv')
ratings.drop(['timestamp'], axis=1, inplace=True)
def replace_name(x):
    return movies[movies['movieId']==x].title.values[0]
ratings.movieId = ratings.movieId.map(replace_name)
M = ratings.pivot_table(index=['userId'], columns=['movieId'], values='rating')
m = M.shape
df1 = M.replace(np.nan, 0, regex=True) 
#Perform eigendecomposition on covariance matrix
cov_mat = np.cov(X_std.T)
eig_vals, eig_vecs = np.linalg.eig(cov_mat)
print('\nEigenvalues \n%s' %eig_vals)

我的代码生成的特征值数量等于电影数量，但我不知道哪个特征值属于哪个电影？

特征值不属于矩阵中的特定行或列，但对于特征向量，正如我所知，在pca算法中，我们计算每个特征的特征值和对流系数，这里是我的电影。特征值和特征向量不是单独计算的，而是作为一个整体计算的。特征向量是特征的组合，或者特征空间中的方向。那么我应该如何在这个数据集上应用主成分分析来减少电影，也许你可以解释你最终想要做什么。通常，在需要预测多个专家的标签的情况下，使用PCA。如果数据集有许多要素，则可以使用它来决定要拾取哪些要素。我看不到很多特征，只看到电影名称和相应的评级。特征值不属于矩阵中的特定行或列，但对于特征向量，正如我所知，在pca算法中，我们计算每个特征的特征值和对流系数，这里是我的电影。特征值和特征向量不是单独计算的，而是作为一个整体计算的。特征向量是特征的组合，或者特征空间中的方向。那么我应该如何在这个数据集上应用主成分分析来减少电影，也许你可以解释你最终想要做什么。通常，在需要预测多个专家的标签的情况下，使用PCA。如果数据集有许多要素，则可以使用它来决定要拾取哪些要素。就你的情况而言，我看不到太多的功能，只看到电影名称和相应的评级。