Python 如何使用tfidf矢量器自动执行文本矢量化?

Python 如何使用tfidf矢量器自动执行文本矢量化?,python,for-loop,tf-idf,Python,For Loop,Tf Idf,我有一个列车数据帧和测试数据帧。列车数据框只有文本列,它被清除,测试数据框只有一列 train_data test_data 我已经训练了一个tfidf矢量器,所以我要扔掉它 joblib.dump(vectorizer_skills, 'vectorizer_skills.pkl') 转换列车数据时,每列列车数据将使用相同的测试数据 container_1 = dict() container_2 = dict() 正在创建容器,以便列车矢量化数据可以存储在容器_1中,测试矢量化数据可

我有一个列车数据帧和测试数据帧。列车数据框只有文本列,它被清除,测试数据框只有一列

train_data 
test_data
我已经训练了一个tfidf矢量器,所以我要扔掉它

joblib.dump(vectorizer_skills, 'vectorizer_skills.pkl')
转换列车数据时,每列列车数据将使用相同的测试数据

container_1 = dict()
container_2 = dict()
正在创建容器,以便列车矢量化数据可以存储在容器_1中,测试矢量化数据可以存储在容器_2中,并具有各自的列名

for item in train_data.columns:
container_1[item] = vectorizer_skills.transform(train_data[item])
container_2[item] = vectorizer_skills.transform(test_data['Cleaned_Column'])
这不起作用,如果我一个接一个地进行矢量化,那么它就起作用了,但是我在火车数据中有30多个文本列,这将花费很多时间。如何解决这个问题