Python 如何预测看不见的文本的情感?

Python 如何预测看不见的文本的情感?,python,scikit-learn,sentiment-analysis,Python,Scikit Learn,Sentiment Analysis,使用scikit learn,我已经训练了我的模型,但不知道如何使用该模型预测新的文本段落。我看了很多教程,但没有一个能超越培训和测试。下面是我使用的代码 data_source_url = "/path/to/file.csv" airline_tweets = pd.read_csv(data_source_url) features = airline_tweets.iloc[:, 10].values labels = airline_tweets.iloc[:,

使用scikit learn,我已经训练了我的模型,但不知道如何使用该模型预测新的文本段落。我看了很多教程,但没有一个能超越培训和测试。下面是我使用的代码

data_source_url = "/path/to/file.csv"
airline_tweets = pd.read_csv(data_source_url)

features = airline_tweets.iloc[:, 10].values
labels = airline_tweets.iloc[:, 1].values

processed_features = []

    # I do some text processing here and then append the text to processed_features

        
vectorizer = CountVectorizer(analyzer = 'word', lowercase = False)
features = vectorizer.fit_transform(processed_features)
features_nd = features.toarray() # for easy usage

X_train, X_test, y_train, y_test  = train_test_split(features_nd, labels, train_size=0.80, random_state=1234)

log_model = LogisticRegression()
log_model = log_model.fit(X=X_train, y=y_train)
    
predictions = log_model.predict(X_test)
    

基本上,您只需要按照相同的步骤转换新的数据集。然后,使用经过训练的模型进行预测。看起来是这样的:

new_数据集=…#阅读您的新数据集
新的_处理的_功能=[]
#在这里执行相同的文本处理
#使用相同的矢量器转换新数据集
新特征=矢量化器.变换(新特征)
new_features\u nd=new_features.toarray()#便于使用
#使用经过训练的模型预测新数据集
新预测=对数模型。预测(新特征)

文本分类器是从哪里来的?你的意思是
log\u模型。预测(X\u测试)
?是的,你是对的。我是说对数模型。预测(X检验)