Csv 我如何设置“a”的体系结构;“大数据”;分析项目?

Csv 我如何设置“a”的体系结构;“大数据”;分析项目?,csv,hadoop,bigdata,Csv,Hadoop,Bigdata,我和我的一个朋友正在上大四,不久将开始一个大四的项目。我们的想法是为它做一个数据分析和数据可视化项目。我们的项目包括读取每2分钟更新一次的CSV文件,解析该数据,然后将其存储在数据库中。一旦数据被存储,我们希望对其运行一些分析,并提供一个API,通过它我们可以访问数据,以某种方式进行可视化。我们的最终目标是构建一个Android应用程序,以用户友好的格式显示CSV和分析中的一些原始数据。我和另一个CS专业的学生谈过,他解释说我需要几个不同的服务器来完成这项工作:一个用于存储,另一个用于分析,另一

我和我的一个朋友正在上大四,不久将开始一个大四的项目。我们的想法是为它做一个数据分析和数据可视化项目。我们的项目包括读取每2分钟更新一次的CSV文件,解析该数据,然后将其存储在数据库中。一旦数据被存储,我们希望对其运行一些分析,并提供一个API,通过它我们可以访问数据,以某种方式进行可视化。我们的最终目标是构建一个Android应用程序,以用户友好的格式显示CSV和分析中的一些原始数据。我和另一个CS专业的学生谈过,他解释说我需要几个不同的服务器来完成这项工作:一个用于存储,另一个用于分析,另一个用于某种类型的队列,以确保在我们进行抓取和分析时不会出现问题。问题是,我真的不知道从哪里开始。我以前曾使用SQL数据库和PHP前端做过一些工作,但没有使用多个服务器。我听说过Hadoop这样的大数据项目可以使用的工具,但我不确定它在哪里合适。如果有人能给我指出某种资源来解释,或者解释他们自己,我将如何开始构建这种项目,那将是非常棒的

由于您在这些方面没有太多经验,您可能会想看看像Cloudera这样的项目。特别是他们的网页上有一组很好的视频和文章

另一个可靠信息来源(我个人使用)是单击堆栈溢出
标记
并选择
投票
选项。关于过多主题的许多好问题已经存在