Hadoop 如何解决flume在从twitter流式传输数据时出现的404错误?

Hadoop 如何解决flume在从twitter流式传输数据时出现的404错误?,hadoop,twitter,flume,flume-ng,Hadoop,Twitter,Flume,Flume Ng,我正在尝试使用flume从Twitter API流式传输一些数据。代码最初确实起了作用。但现在我得到了404错误: INFO twitter4j.TwitterStreamImpl: 404: The URI requested is invalid or the resource requested, such as a user, does not exist. Unknown URL. See Twitter Streaming API documentation at http://d

我正在尝试使用flume从Twitter API流式传输一些数据。代码最初确实起了作用。但现在我得到了404错误:

INFO twitter4j.TwitterStreamImpl: 404: The URI requested is invalid or the resource requested, such as a user, does not exist.

Unknown URL. See Twitter Streaming API documentation at http://dev.twitter.com/pages/streaming_api 
下面是我的conf文件代码

TwitterAgent.sources= Twitter
TwitterAgent.channels= MemChannel
TwitterAgent.sinks=HDFS
TwitterAgent.sources.Twitter.type = com.cloudera.flume.source.TwitterSource
TwitterAgent.sources.Twitter.channels=MemChannel

TwitterAgent.sources.Twitter.consumerKey=<code>
TwitterAgent.sources.Twitter.consumerSecret=    <code>
TwitterAgent.sources.Twitter.accessToken=<code>
TwitterAgent.sources.Twitter.accessTokenSecret= <code>

TwitterAgent.sources.Twitter.keywords= hadoop, bigdata

TwitterAgent.sinks.HDFS.channel=MemChannel
TwitterAgent.sinks.HDFS.type=hdfs
TwitterAgent.sinks.HDFS.hdfs.path=hdfs://localhost:8020/user/flume/tweets
TwitterAgent.sinks.HDFS.hdfs.fileType=DataStream
TwitterAgent.sinks.HDFS.hdfs.writeformat=Text
TwitterAgent.sinks.HDFS.hdfs.batchSize=1000
TwitterAgent.sinks.HDFS.hdfs.rollSize=0
TwitterAgent.sinks.HDFS.hdfs.rollCount=10000
TwitterAgent.sinks.HDFS.hdfs.rollInterval=600
TwitterAgent.channels.MemChannel.type=memory
TwitterAgent.channels.MemChannel.capacity=10000
TwitterAgent.channels.MemChannel.transactionCapacity=100

我只是手动同步了VMware和windows系统的时间,问题就解决了

一般来说,cloudera代码内部存在问题。或者Twitter禁用了您的API密钥(单击链接,它不存在)谢谢您的回复,这是我的本地存储和hdfs之间的时间同步错误。没错,CDH VM无法很好地同步时间。请在下面添加您的解决方案。我刚刚手动同步了VMware和我的windows系统的时间,问题就解决了。同样,您可以将此作为一个答案,而不是评论