Machine learning 在机器学习模型中使用文本情感作为特征?

Machine learning 在机器学习模型中使用文本情感作为特征?,machine-learning,sentiment-analysis,data-science,text-analysis,Machine Learning,Sentiment Analysis,Data Science,Text Analysis,我正在研究我的机器学习模型的哪些特性,以及我拥有的数据。我的数据包含很多文本数据,所以我想知道如何从中提取有价值的特征。与我之前的想法相反,这通常包括用一袋单词或类似word2vec:() 因为我对这个主题的理解是有限的,我不明白为什么我不能先分析文本来得到数值。(例如:textBlob.touction=,谷歌云自然语言=) 这是否有问题,或者我是否可以将这些值用作我的机器学习模型的功能 提前感谢所有的帮助 当然,您可以使用情感分析将文本输入转换为单个数字,然后将此数字用作机器学习模型中的一个

我正在研究我的机器学习模型的哪些特性,以及我拥有的数据。我的数据包含很多文本数据,所以我想知道如何从中提取有价值的特征。与我之前的想法相反,这通常包括用一袋单词或类似word2vec:()

因为我对这个主题的理解是有限的,我不明白为什么我不能先分析文本来得到数值。(例如:textBlob.touction=,谷歌云自然语言=)

这是否有问题,或者我是否可以将这些值用作我的机器学习模型的功能


提前感谢所有的帮助

当然,您可以使用情感分析将文本输入转换为单个数字,然后将此数字用作机器学习模型中的一个功能。这种方法没有错

问题是要从文本数据中提取什么样的信息。因为情绪分析将文本输入转换为-1到1之间的数字,该数字表示文本的积极或消极程度。例如,您可能需要客户对某个餐厅的评论的情绪信息来衡量他们的满意度。在这种情况下,可以使用情绪分析对文本数据进行预处理

但同样,情绪分析只是给出了文本的积极或消极程度的概念。您可能希望对文本数据进行聚类,而情感信息在这种情况下并不有用,因为它不提供任何关于文本相似性的信息。因此,其他方法(如word2vec或bag of words)将用于这些任务中文本数据的表示。因为这些算法提供了单个数字的文本实例的向量表示


总之,该方法取决于您需要从特定任务的数据中提取什么样的信息

谢谢你的回复!这很有道理,谢谢。我正在根据youtube、twitter和facebook的用户数据制作一个预测电影票房成功的模型。我想说,情感是一个有价值的特征。此外,对文本进行聚类是否也适用于我的情况?不,你的问题不是聚类,而是基于如何衡量成功的回归或分类任务。我认为情绪分析可以解决你的问题。因为,如果用户对一部电影的评价是肯定的,那么票房就真的成功了,反之亦然。