Python 如何在scikit learn的基本情绪分析中使用多种功能?

Python 如何在scikit learn的基本情绪分析中使用多种功能?,python,scikit-learn,Python,Scikit Learn,我已经试着把这个问题简化为最基本的问题。假设我有如下数据(csv): 我有这个代码,通过在文本列上使用BoW(在本例中为tf idf)在标签上进行训练。我做了一个70/30的列车测试,一切都很好 vec = TfidfVectorizer() clf = MultinomialNB() training_data = pd.read_csv('trainset.csv', delimiter=',') text_tfidf = vec.fit_transform(training_data['t

我已经试着把这个问题简化为最基本的问题。假设我有如下数据(csv):

我有这个代码,通过在文本列上使用BoW(在本例中为tf idf)在标签上进行训练。我做了一个70/30的列车测试,一切都很好

vec = TfidfVectorizer()
clf = MultinomialNB()
training_data = pd.read_csv('trainset.csv', delimiter=',')
text_tfidf = vec.fit_transform(training_data['text-column'])
# gen_tfidf = vec.fit_transform(training_data['gender-column'])
X_train, X_test, y_train, y_test = train_test_split(text_tfidf, training_data['label'], test_size = 0.3)
clf.fit(X_train, y_train)
然而,就我的一生而言,我根本不知道如何使用多个功能。例如,我想使用文本栏和性别栏来训练模型,看看这会如何影响准确性,但我不知道如何做到这一点

我是否遗漏了一些重要的概念?多谢各位

vec = TfidfVectorizer()
clf = MultinomialNB()
training_data = pd.read_csv('trainset.csv', delimiter=',')
text_tfidf = vec.fit_transform(training_data['text-column'])
# gen_tfidf = vec.fit_transform(training_data['gender-column'])
X_train, X_test, y_train, y_test = train_test_split(text_tfidf, training_data['label'], test_size = 0.3)
clf.fit(X_train, y_train)