Java 在MapReduce作业中使用selenium对Hadoop有好处吗?

Java 在MapReduce作业中使用selenium对Hadoop有好处吗?,java,selenium,hadoop,Java,Selenium,Hadoop,我正在使用hadoop做一个项目,它使用selenium从各种twitter帐户收集推文。我不想一个接一个地执行,而是希望使用hadoop同时执行这些操作,以减少收集时间。这听起来可行吗?它是hadoop的一个很好的用途吗 Twitter有一个流式API,您可以使用该API获取恒定的推文流,并将其加载到HDFS中,并使用任何处理框架(Hive、storm、spark)对这些推文进行处理。如果您不想使用TwitterAPI编写代码,可以使用ApacheNIFI或Flume为您生成推文,并将其加载到

我正在使用hadoop做一个项目,它使用selenium从各种twitter帐户收集推文。我不想一个接一个地执行,而是希望使用hadoop同时执行这些操作,以减少收集时间。这听起来可行吗?它是hadoop的一个很好的用途吗

Twitter有一个流式API,您可以使用该API获取恒定的推文流,并将其加载到HDFS中,并使用任何处理框架(Hive、storm、spark)对这些推文进行处理。如果您不想使用TwitterAPI编写代码,可以使用ApacheNIFI或Flume为您生成推文,并将其加载到HDFS,那么可以使用打包工具


Twitter有一个流式API,您可以使用它来获取恒定的推文流,并将其加载到HDFS中,并使用任何处理框架(Hive、storm、spark)来理解这些推文。如果您不想使用TwitterAPI编写代码,可以使用ApacheNIFI或Flume为您生成推文,并将其加载到HDFS,那么可以使用打包工具