Warning: file_get_contents(/data/phpspider/zhask/data//catemap/3/apache-spark/5.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/3/flash/4.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Apache spark 什么是阿帕奇齐柏林飞艇?_Apache Spark_Bigdata_Apache Zeppelin - Fatal编程技术网

Apache spark 什么是阿帕奇齐柏林飞艇?

Apache spark 什么是阿帕奇齐柏林飞艇?,apache-spark,bigdata,apache-zeppelin,Apache Spark,Bigdata,Apache Zeppelin,正如我们经常听到的《阿帕奇齐柏林飞艇》(ApacheZeppelin)一样,我们的脑海中几乎没有问题: 什么是阿帕奇齐柏林飞艇 它为大数据生态系统增加了哪些新的和/或额外的功能 它是否已经取代了一些框架/工具 存在于大数据生态系统中 什么是笔记本界面 交互运行代码、探索和可视化数据的界面。它们允许您混合叙述、富媒体和数据 简短回答:基于网络的笔记本电脑,支持数据驱动, 使用SQL、Scala等进行交互式数据分析和协作文档 长答案: 齐柏林飞艇笔记本为您提供了一种在网络笔记本中执行任意代码的简单

正如我们经常听到的《阿帕奇齐柏林飞艇》(ApacheZeppelin)一样,我们的脑海中几乎没有问题:

  • 什么是阿帕奇齐柏林飞艇
  • 它为大数据生态系统增加了哪些新的和/或额外的功能
  • 它是否已经取代了一些框架/工具 存在于大数据生态系统中

  • 什么是笔记本界面

    交互运行代码、探索和可视化数据的界面。它们允许您混合叙述、富媒体和数据


    简短回答:基于网络的笔记本电脑,支持数据驱动, 使用SQL、Scala等进行交互式数据分析和协作文档

    长答案:

  • 齐柏林飞艇笔记本为您提供了一种在网络笔记本中执行任意代码的简单、直接的方法。您可以执行Scala、SQL,甚至可以安排作业(通过cron)定期运行

  • 首先,在同一个笔记本中混合语言更容易。您可以执行一些SQL、scala,然后标记以将其全部记录在一起。您还可以轻松地将笔记本转换为演示样式—用于向管理层演示或在仪表板中使用

  • Jupyter(以前称为IPython)笔记本在Python社区非常流行。我不能用“替换”这个词,而是用类似的

    • 齐柏林飞艇支持Spark、PySpark、Spark R、Spark SQL和依赖项加载器

    • 齐柏林飞艇允许无缝连接任何JDBC数据源。Postgresql、Mysql、MariaDB、Redshift、ApacheHive等

    • Matplotlib、Conda、Pandas SQL和PySpark集成支持Python


    齐柏林飞艇是一个伟大的工具。它允许在单个笔记本中使用不同的后端/语言。下面是一个简单的用例

  • 用减价法写一些描述
  • 使用Shell准备数据。e、 g.使用curl/wget下载文件,注入HDFS
  • 用Spark做数据分析
  • 使用SQL进行简单可视化
  • 使用Shell导出结果
  • 使用链接发布图形
  • 所有这些步骤都可以在一个笔记本中完成。而且在一个笔记本上可以做更多的事情


    齐柏林飞艇与Databricks.com在线解决方案非常接近

    您是否阅读了官方页面上的描述?上面说什么?至于问题2和问题3,我担心它们偏离了主题。我投票结束这个问题。