Python 如何预测看不见的文本的情感?
使用scikit learn,我已经训练了我的模型,但不知道如何使用该模型预测新的文本段落。我看了很多教程,但没有一个能超越培训和测试。下面是我使用的代码Python 如何预测看不见的文本的情感?,python,scikit-learn,sentiment-analysis,Python,Scikit Learn,Sentiment Analysis,使用scikit learn,我已经训练了我的模型,但不知道如何使用该模型预测新的文本段落。我看了很多教程,但没有一个能超越培训和测试。下面是我使用的代码 data_source_url = "/path/to/file.csv" airline_tweets = pd.read_csv(data_source_url) features = airline_tweets.iloc[:, 10].values labels = airline_tweets.iloc[:,
data_source_url = "/path/to/file.csv"
airline_tweets = pd.read_csv(data_source_url)
features = airline_tweets.iloc[:, 10].values
labels = airline_tweets.iloc[:, 1].values
processed_features = []
# I do some text processing here and then append the text to processed_features
vectorizer = CountVectorizer(analyzer = 'word', lowercase = False)
features = vectorizer.fit_transform(processed_features)
features_nd = features.toarray() # for easy usage
X_train, X_test, y_train, y_test = train_test_split(features_nd, labels, train_size=0.80, random_state=1234)
log_model = LogisticRegression()
log_model = log_model.fit(X=X_train, y=y_train)
predictions = log_model.predict(X_test)
基本上,您只需要按照相同的步骤转换新的数据集。然后,使用经过训练的模型进行预测。看起来是这样的:
new_数据集=…#阅读您的新数据集
新的_处理的_功能=[]
#在这里执行相同的文本处理
#使用相同的矢量器转换新数据集
新特征=矢量化器.变换(新特征)
new_features\u nd=new_features.toarray()#便于使用
#使用经过训练的模型预测新数据集
新预测=对数模型。预测(新特征)
文本分类器是从哪里来的?你的意思是log\u模型。预测(X\u测试)
?是的,你是对的。我是说对数模型。预测(X检验)