Python 电影分级用户id索引
我正在尝试使用ratings.csv建立一个电影推荐系统。我通过用户id和电影id使用pivot()构建了一个评级矩阵Python 电影分级用户id索引,python,numpy,Python,Numpy,我正在尝试使用ratings.csv建立一个电影推荐系统。我通过用户id和电影id使用pivot()构建了一个评级矩阵 mydf = mydf.pivot(index='user_Id', columns='movie_Id', values='rating').fillna(0).astype(int) mymatrix = mydf.as_matrix() 只要这样做: dict(zip(list(mydf.index), list(range(len(mydf.index)))))
mydf = mydf.pivot(index='user_Id', columns='movie_Id', values='rating').fillna(0).astype(int)
mymatrix = mydf.as_matrix()
只要这样做:
dict(zip(list(mydf.index), list(range(len(mydf.index)))))
{22: 0, 23: 1, 25: 2, 31: 3, 142: 4}
这是完整的代码
user_Id;movie_Id;rating
22;453;0
23;545;1
25;642;2
31;237;3
142;348;4
import pandas as pd
mydf = pd.read_clipboard(sep=';')
mydf = mydf.pivot(index='user_Id', columns='movie_Id', values='rating').fillna(0).astype(int)
dict(zip(list(mydf.index), list(range(len(mydf.index)))))
{22: 0, 23: 1, 25: 2, 31: 3, 142: 4}
您现在的输出是什么@卡拉:请参阅下面的解决方案