Warning: file_get_contents(/data/phpspider/zhask/data//catemap/0/hadoop/6.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
了解Hadoop生态系统的最佳方式是什么_Hadoop_Data Science - Fatal编程技术网

了解Hadoop生态系统的最佳方式是什么

了解Hadoop生态系统的最佳方式是什么,hadoop,data-science,Hadoop,Data Science,我是一名数据科学家,有纯数学的背景,所以我在工具方面有点学习曲线。通过在该行业工作大约一年,我了解到数据科学家也应该了解一些数据工程。有人能告诉我一些资源吗?我目前的技术主要包括Python(Pyspark)等。取决于您想了解Hadoop生态系统的具体内容 我建议你从这本书开始: 它可以帮助您了解它是如何工作的,并了解Hadoop生态系统是由什么组成的。你不需要这本书的所有章节,但其中许多章节可能真的很有用 你也应该看看这本书 由于spark在数据科学领域中被广泛使用。但这本书比上一本更实

我是一名数据科学家,有纯数学的背景,所以我在工具方面有点学习曲线。通过在该行业工作大约一年,我了解到数据科学家也应该了解一些数据工程。有人能告诉我一些资源吗?我目前的技术主要包括Python(Pyspark)等。

取决于您想了解Hadoop生态系统的具体内容

我建议你从这本书开始:

  • 它可以帮助您了解它是如何工作的,并了解Hadoop生态系统是由什么组成的。你不需要这本书的所有章节,但其中许多章节可能真的很有用
你也应该看看这本书

  • 由于spark在数据科学领域中被广泛使用。但这本书比上一本更实用

要了解更多有关Spark的信息,您并不需要了解Hadoop。例如,Databricks有足够的资源来使用spark,并且没有Hadoop产品。你对生态系统有什么特别的好奇?存储行程安排?DataViz?安全