Python 利用twitter预测股市
我试图通过推特预测股票市场价值的每日正面或负面。Python 利用twitter预测股市,python,twitter,machine-learning,yahoo-finance,Python,Twitter,Machine Learning,Yahoo Finance,我试图通过推特预测股票市场价值的每日正面或负面。 我对这个话题做了很多研究,发现这是一个开始。 基本上,我所做的是从雅虎金融公司得到与Down Jones相关的日期,然后计算当天是正是负 对于同一天,获取所有包含诸如“我是、感觉到、让我成为”等词的tweet,以便只收集表达情感的tweet 我有一个单词列表(肯定和否定),没有分数,只有单词。 对于分析的每一天,我都创建了一个Python字典,它以列表中的单词作为关键字,以分数作为值,计算方式如下: score of a word = num o
我对这个话题做了很多研究,发现这是一个开始。
基本上,我所做的是从雅虎金融公司得到与Down Jones相关的日期,然后计算当天是正是负 对于同一天,获取所有包含诸如“我是、感觉到、让我成为”等词的tweet,以便只收集表达情感的tweet
我有一个单词列表(肯定和否定),没有分数,只有单词。
对于分析的每一天,我都创建了一个Python字典,它以列表中的单词作为关键字,以分数作为值,计算方式如下:
score of a word = num of times the word matches tweets in a day /
num of total matches of all words
为了预测股票市场,我训练朴素贝叶斯算法作为数据,python字典根据金融数据将单词和相对分数作为目标“pos”或“neg”
我收集了一年的数据(从2010年1月1日到2010年12月31日)单词列表的长度为18540。
我正在使用Python 3.4、tweepy和scikit学习 分类器不能很好地工作,因为我是这个领域的新手,我想问你我的过程中是否有错误,或者你是否有一些建议来帮助我
感谢您的帮助如果没有看到您的代码,我们如何判断代码中是否有错误?我的意思是在逻辑中。我找到了很多关于这方面的文章,但我不知道我的过程是否是解决这一问题的“最佳实践”。我不确定这是一个合适的地方,可以就这样的应用程序的逻辑征求意见。也许问题在于你的基本假设,即市场和你所分类的词之间存在相关性。在没有看到你的代码的情况下,我们如何判断其中是否有错误?我的意思是在逻辑上。我找到了很多关于这方面的文章,但我不知道我的过程是否是解决这一问题的“最佳实践”。我不确定这是一个合适的地方,可以就这样的应用程序的逻辑征求意见。也许问题在于你的基本假设,即市场与你所分类的词之间存在相关性。