Neural network 基于Tweet数据的情绪分类神经网络设计

Neural network 基于Tweet数据的情绪分类神经网络设计,neural-network,sentiment-analysis,feature-extraction,Neural Network,Sentiment Analysis,Feature Extraction,我有一个包含四种情绪的推特数据集(愤怒、快乐、恐惧、悲伤)。例如,我将tweet转换为类似于以下愤怒输入向量的向量: 愤怒标记的频率分布平均值 word2vec与愤怒的相似性 情绪词汇中的愤怒平均值 hashtag词典中愤怒的平均值 这个向量对训练神经网络有效吗?你的输入向量一开始看起来不错。当然,您以后可能会使用来自twitter或其他相关API或数据集的统计数据和衍生数据使其更加先进 您的网络有四个输出,正如您所提到的: Joy:[1,0,0,0] 悲伤:[0,1,0,0] 恐惧:[0,0,

我有一个包含四种情绪的推特数据集(愤怒、快乐、恐惧、悲伤)。例如,我将tweet转换为类似于以下愤怒输入向量的向量:

愤怒标记的频率分布平均值

word2vec
与愤怒的相似性

情绪词汇中的愤怒平均值

hashtag词典中愤怒的平均值


这个向量对训练神经网络有效吗?

你的输入向量一开始看起来不错。当然,您以后可能会使用来自twitter或其他相关API或数据集的统计数据和衍生数据使其更加先进

您的网络有四个输出,正如您所提到的:

Joy:[1,0,0,0]
悲伤:[0,1,0,0] 恐惧:[0,0,1,0]
愤怒:[0,0,0,1]

你可以考虑添加多个隐藏层,如果你愿意的话,让它成为一个深度网络,以提高你的神经网络原型的稳定性。p> 正如您的问题所示,在培训和测试您的数据之前,最好有一个好的预处理器和特征提取系统,您显然知道项目的发展方向

伟大的项目,最美好的祝愿,感谢您提出的好问题,欢迎访问stackoverflow.com


大家好,欢迎来到StackOverflow。请花些时间阅读帮助页面,特别是命名和的部分。更重要的是,请阅读。您可能还想了解。非常感谢您的回答。当我建立网络来测试我的特征向量时,这是一个挑战。一个是多个密集层,另一个是两个卷积一维网络,我对结果不满意。这让我对我建议的向量产生了怀疑。所以如果我得到的训练向量看起来像0.071428571 0.902887591 0.005818786 0.214285714 0.276094297 0.004706386 0.142857143 0.071428571 0.617585755 0.006649071 0.071428571 0.42533003 0.005618695 0.071428571,输出是愤怒和喜悦,所以输出向量是1010,所构建的网络是输入层,12个密集的第一隐层,然后8个节点在第二隐层,最后4个输出神经元。训练数据集5000的准确率为48%,测试数据集1000的准确率为25%。批次100和20个历元,激活relu和输出sigmoid