Python 如何预测看不见的文本的情感？_Python_Scikit Learn_Sentiment Analysis

Python 如何预测看不见的文本的情感？

python scikit-learn

Python 如何预测看不见的文本的情感？,python,scikit-learn,sentiment-analysis,Python,Scikit Learn,Sentiment Analysis,使用scikit learn，我已经训练了我的模型，但不知道如何使用该模型预测新的文本段落。我看了很多教程，但没有一个能超越培训和测试。下面是我使用的代码 data_source_url = "/path/to/file.csv" airline_tweets = pd.read_csv(data_source_url) features = airline_tweets.iloc[:, 10].values labels = airline_tweets.iloc[:,

使用scikit learn，我已经训练了我的模型，但不知道如何使用该模型预测新的文本段落。我看了很多教程，但没有一个能超越培训和测试。下面是我使用的代码

data_source_url = "/path/to/file.csv"
airline_tweets = pd.read_csv(data_source_url)

features = airline_tweets.iloc[:, 10].values
labels = airline_tweets.iloc[:, 1].values

processed_features = []

    # I do some text processing here and then append the text to processed_features

        
vectorizer = CountVectorizer(analyzer = 'word', lowercase = False)
features = vectorizer.fit_transform(processed_features)
features_nd = features.toarray() # for easy usage

X_train, X_test, y_train, y_test  = train_test_split(features_nd, labels, train_size=0.80, random_state=1234)

log_model = LogisticRegression()
log_model = log_model.fit(X=X_train, y=y_train)
    
predictions = log_model.predict(X_test)

基本上，您只需要按照相同的步骤转换新的数据集。然后，使用经过训练的模型进行预测。看起来是这样的：

new_数据集=…#阅读您的新数据集
新的_处理的_功能=[]
#在这里执行相同的文本处理
#使用相同的矢量器转换新数据集
新特征=矢量化器.变换（新特征）
new_features\u nd=new_features.toarray（）#便于使用
#使用经过训练的模型预测新数据集
新预测=对数模型。预测（新特征）

文本分类器是从哪里来的？你的意思是

log\u模型。预测（X\u测试）

？是的，你是对的。我是说对数模型。预测（X检验）