Twitter 情感分析中如何进行迁移学习?

Twitter 情感分析中如何进行迁移学习?,twitter,deep-learning,sentiment-analysis,transfer-learning,Twitter,Deep Learning,Sentiment Analysis,Transfer Learning,我想建立一个应用程序,我可以输入任何推特关键字,后端将抓取相关推文,并返回负面,中性和积极推文百分比的情绪分析推文。例如,我输入关键字“pepsi”,应用程序将输出如下内容:与pepsi相关的推特包含10%的负面情绪、10%的中性情绪和80%的正面评论 所以问题是如何训练一个机器学习算法,我可以在后端使用它对各种主题进行情感分析。这里涉及的主要思想是转移学习,我们在大量标记数据上训练一个模型,并将其用作训练其他数据的基线。迁移学习在自然语言处理中具有局限性,主要是因为在一项任务中学习到的知识不够

我想建立一个应用程序,我可以输入任何推特关键字,后端将抓取相关推文,并返回负面,中性和积极推文百分比的情绪分析推文。例如,我输入关键字“pepsi”,应用程序将输出如下内容:与pepsi相关的推特包含10%的负面情绪、10%的中性情绪和80%的正面评论

所以问题是如何训练一个机器学习算法,我可以在后端使用它对各种主题进行情感分析。这里涉及的主要思想是转移学习,我们在大量标记数据上训练一个模型,并将其用作训练其他数据的基线。迁移学习在自然语言处理中具有局限性,主要是因为在一项任务中学习到的知识不够广泛,无法下游到其他任务。例如,我预先训练了一个好的神经网络,对航空公司进行情绪分析,预测准确率超过70%。然而,当我使用相同的模型对百事可乐进行情绪分析时,我得到的预测准确率只有30%左右


我做了一些研究,发现谷歌的通用语句嵌入非常流行。然而,我意识到这是一种将输入文本转换为特征向量的新方法,而不是通用算法。我想知道有人能告诉我该去哪里吗?提前多谢

他们成功地将迁移学习用于文本分类任务。你应该看看。

谢谢@xashru!我会去看看。我发现这个教程很有用,如果有人想从熊猫数据框中存储的干净文本开始尝试。ULMFit模型的简短概述:从预训练的语言模型(非分类模型)开始,使用您自己的数据微调语言模型(可以有小到100个条目,在这个阶段标记为不需要),然后从这个微调的语言模型中提取编码器,将其与分类器配对,微调分类器(您需要在此处添加标签!).至于我最初的问题,答案是否定的——没有这样的通用模型可以在不进一步调整您感兴趣的特定领域或标记数据的情况下进行情绪分析。ULMFit性能相当好,请记住,您仍然需要标记数据来评估模型的性能。