特维。在python数据帧中存储tweet文本
我正在学习一个在线教程(),尽管编写了相同的python脚本,我还是被卡住了。我不是很精通python,而且很难理解地图文档(教程中使用的)。现在我得到了“valueError无法设置没有定义索引的帧和无法转换为序列的值”,并且无法找到修复方法。我的印象是dataframe将有3列。一条是所有的推文,一条是关于facebook的推文,还有一条是关于微软的推文。我还意识到教程已经有两年了,所以可能有一些语法不推荐使用?谢谢你的帮助特维。在python数据帧中存储tweet文本,python,pandas,tweepy,Python,Pandas,Tweepy,我正在学习一个在线教程(),尽管编写了相同的python脚本,我还是被卡住了。我不是很精通python,而且很难理解地图文档(教程中使用的)。现在我得到了“valueError无法设置没有定义索引的帧和无法转换为序列的值”,并且无法找到修复方法。我的印象是dataframe将有3列。一条是所有的推文,一条是关于facebook的推文,还有一条是关于微软的推文。我还意识到教程已经有两年了,所以可能有一些语法不推荐使用?谢谢你的帮助 import json import pandas as pd
import json
import pandas as pd
import re
tweets_data_path = "Desktop/twit_dat/tweet1.txt"
tweets_data = []
tweets_file = open(tweets_data_path, "r")
for line in tweets_file:
try:
tweet = json.loads(line)
tweets_data.append(tweet)
except:
continue
tweets = pd.DataFrame()
tweets['text'] = map(lambda tweet: tweet['text'], tweets_data)
tweets['Facebook'] = tweets['text'].apply(lambda tweet: word_in_text('Facebook', tweet))
tweets['Microsoft'] = tweets['text'].apply(lambda tweet: word_in_text('Microsoft', tweet))
def word_in_text(word,text):
if text == None:
return False
word = word.lower()
text = text.lower()
match = re.search(word,text)
if match:
return True
else:
return False
以下是我正在使用的数据示例:
也许你的熊猫版本更低。我复制了代码并在编译器上运行良好。看看这是否有用。
--这更多的是一个注释,但我没有这种特权--。我认为直接将文本文件导入数据框会更容易,而无需向列表中添加数据。如果您发布了原始文件的一些原始数据,我们会尽力帮助您。@FabioLamanna谢谢,新的链接将示例数据附加到原始问题中