Python 3.x 在TFIDF算法中,有没有办法将多列作为训练数据集?

Python 3.x 在TFIDF算法中,有没有办法将多列作为训练数据集?,python-3.x,recommendation-engine,tfidfvectorizer,Python 3.x,Recommendation Engine,Tfidfvectorizer,我一直在尝试TF_IDF推荐算法,成功开发了一列作为输入,一列作为输出的推荐算法。 现在,我想用四列作为训练数据集,但它不起作用,有什么想法吗 这是我的数据集 代码我一直在尝试 import pandas as pd from sklearn.feature_extraction.text import TfidfVectorizer from sklearn.metrics.pairwise import cosine_similarity data = pd.read_csv("

我一直在尝试TF_IDF推荐算法,成功开发了一列作为输入,一列作为输出的推荐算法。 现在,我想用四列作为训练数据集,但它不起作用,有什么想法吗

这是我的数据集

代码我一直在尝试

import pandas as pd
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.metrics.pairwise import cosine_similarity

data = pd.read_csv("ADL Dataset V1.csv", sep=",")

reactants = data["Name"]["Smile Canonical"]["Mobile phase"]["Chomatrographic mode"]
reactans = reactants.tolist()
targets = data["Column"].tolist()

# TFIDF vector representation
vectorizer = TfidfVectorizer()
X = vectorizer.fit_transform(targets)
# Taking first record as test sample X[0:1]
cosine_similarities = cosine_similarity(X[0:1], X).flatten()

# Extract top 5 similarity records
similarity = cosine_similarities.argsort()[:-5:-1]
for sim in similarity:
    print(reactants[sim])
我想通过以上4列作为培训数据集,并提出建议。有人能帮我吗