Python 利用twitter预测股市_Python_Twitter_Machine Learning_Yahoo Finance

Python 利用twitter预测股市

python twitter machine-learning

Python 利用twitter预测股市,python,twitter,machine-learning,yahoo-finance,Python,Twitter,Machine Learning,Yahoo Finance,我试图通过推特预测股票市场价值的每日正面或负面。我对这个话题做了很多研究，发现这是一个开始。基本上，我所做的是从雅虎金融公司得到与Down Jones相关的日期，然后计算当天是正是负对于同一天，获取所有包含诸如“我是、感觉到、让我成为”等词的tweet，以便只收集表达情感的tweet 我有一个单词列表（肯定和否定），没有分数，只有单词。对于分析的每一天，我都创建了一个Python字典，它以列表中的单词作为关键字，以分数作为值，计算方式如下： score of a word = num o

我试图通过推特预测股票市场价值的每日正面或负面。
我对这个话题做了很多研究，发现这是一个开始。
基本上，我所做的是从雅虎金融公司得到与Down Jones相关的日期，然后计算当天是正是负

对于同一天，获取所有包含诸如“我是、感觉到、让我成为”等词的tweet，以便只收集表达情感的tweet

我有一个单词列表（肯定和否定），没有分数，只有单词。
对于分析的每一天，我都创建了一个Python字典，它以列表中的单词作为关键字，以分数作为值，计算方式如下：

score of a word = num of times the word matches tweets in a day /
                  num of total matches of all words

为了预测股票市场，我训练朴素贝叶斯算法作为数据，python字典根据金融数据将单词和相对分数作为目标“pos”或“neg”

我收集了一年的数据（从2010年1月1日到2010年12月31日）
单词列表的长度为18540。
我正在使用Python 3.4、tweepy和scikit学习

分类器不能很好地工作，因为我是这个领域的新手，我想问你我的过程中是否有错误，或者你是否有一些建议来帮助我

感谢您的帮助

如果没有看到您的代码，我们如何判断代码中是否有错误？我的意思是在逻辑中。我找到了很多关于这方面的文章，但我不知道我的过程是否是解决这一问题的“最佳实践”。我不确定这是一个合适的地方，可以就这样的应用程序的逻辑征求意见。也许问题在于你的基本假设，即市场和你所分类的词之间存在相关性。在没有看到你的代码的情况下，我们如何判断其中是否有错误？我的意思是在逻辑上。我找到了很多关于这方面的文章，但我不知道我的过程是否是解决这一问题的“最佳实践”。我不确定这是一个合适的地方，可以就这样的应用程序的逻辑征求意见。也许问题在于你的基本假设，即市场与你所分类的词之间存在相关性。