Python Twitter json文本过滤器

Python Twitter json文本过滤器,python,twitter,Python,Twitter,使用来自Twitter的流式API,我可以获得JSON格式的数据。 但是,我很难使用python从数据集中过滤出某些关键字。以下是我所做的 首先,我定义了空字符串和筛选列表: tweets=[] tweetStr='' tweetsFiltered=[] 然后我打开json文件,将其附加到tweets=[]上,如下所示: for line in open('apple.json'): try: tweets.append(json.loads(line)) ex

使用来自Twitter的流式API,我可以获得JSON格式的数据。 但是,我很难使用python从数据集中过滤出某些关键字。以下是我所做的

首先,我定义了空字符串和筛选列表:

tweets=[]
tweetStr=''
tweetsFiltered=[]
然后我打开json文件,将其附加到tweets=[]上,如下所示:

for line in open('apple.json'):
    try:
        tweets.append(json.loads(line))
    except:
        pass
然后对于tweet数据,我希望过滤关键字并删除

filterKeyword=['eat','cinnamon','fruit','pie','juice']
for tweet in tweets:
    for tweet['text'] in tweet:
        for key in filterKeyword:
            if key in tweet['text']:
                pass
            else:
                tweetsFiltered.append(tweet)
                tweetStr+=str(tweet['text'])
print(tweetStr)
但它只返回JSON文件中的键(我认为它是字典键),如下所示

时间戳\u mstimestamp \u mstimestamp \u mstimestamp \u mstimestamp \u mstimestamp \u msretweetedRetweetedRetweetedRetweetedIn\u回复给用户\u id\u回复给用户\u id\u回复给用户\u id\u回复给用户\u id\u回复给用户\u id\u回复给用户\u id\u状态


在这段代码中,我如何删除某些关键字并保留主要数据“tweets”或添加它tweetStr

您的代码中有一个“tweet['text']在tweet中”的冗余循环。 下面是正确的代码:

filterKeyword=['eat','cinnamon','fruit','pie','juice']
for tweet in tweets:
    for key in filterKeyword:
        if key in tweet['text']:
            pass
        else:
            tweetsFiltered.append(tweet)
            tweetStr+=str(tweet['text'])
print(tweetStr)

它仍然返回filterKeyword:(我应该共享我想要操作的数据文件吗?