Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/video/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Amazon web services AWS EMR齐柏林飞艇缺少MYSQL解释器_Amazon Web Services_Emr_Amazon Emr_Apache Zeppelin - Fatal编程技术网

Amazon web services AWS EMR齐柏林飞艇缺少MYSQL解释器

Amazon web services AWS EMR齐柏林飞艇缺少MYSQL解释器,amazon-web-services,emr,amazon-emr,apache-zeppelin,Amazon Web Services,Emr,Amazon Emr,Apache Zeppelin,我在AWS上与齐柏林飞艇一起启动了一个全新的AWS EMR Spark集群,以查询MYSQL数据库。当我试图在齐柏林飞艇中添加MYSQL解释器时,该选项不存在。我在谷歌上搜索,想找到一种方法让解释器显示出来,但我没有找到解决办法。如何在齐柏林飞艇中获得MYSQL解释器,以便查询MYSQL数据库 < P> > Spice SQL支持了许多代码代码> SQL:2003 和 SQL:2011 < /代码>(1)[2 ],您可以考虑通过添加依赖性来通过ZelPin上的火花来实现这一点。 获取具有正确版

我在AWS上与齐柏林飞艇一起启动了一个全新的AWS EMR Spark集群,以查询MYSQL数据库。当我试图在齐柏林飞艇中添加MYSQL解释器时,该选项不存在。我在谷歌上搜索,想找到一种方法让解释器显示出来,但我没有找到解决办法。如何在齐柏林飞艇中获得MYSQL解释器,以便查询MYSQL数据库


< P> > Spice SQL支持了许多代码<>代码> SQL:2003 和<代码> SQL:2011 < /代码>(1)[2 ],您可以考虑通过添加依赖性来通过ZelPin上的火花来实现这一点。

  • 获取具有正确版本的mysql连接器
  • 将其添加为齐柏林飞艇上Spark解释器的依赖项。(我把罐子放在主机上)
  • 您现在应该能够访问MySQL表。以下是使用Scala API的示例:

    /* Database Configuration*/
    val jdbcURL = s"jdbc:mysql://${HOST}/${DATABASE}"
    val jdbcUsername = s"${USERNAME}"
    val jdbcPassword = s"${PASSWORD}"
    
    import java.util.Properties
    val connectionProperties = new Properties()
    connectionProperties.put("user", jdbcUsername)
    connectionProperties.put("password", jdbcPassword)
    connectionProperties.put("driver", "com.mysql.cj.jdbc.Driver")
    
    /* Read Data from MySQL */
    val desiredData = spark.read.jdbc(jdbcURL, "${TABLE NAME}", connectionProperties)
    desiredData.printSchema
    
    /* Data Manipulation */
    desiredData.createOrReplaceTempView("desiredData")
    val query = s"""
    SELECT COUNT(*) AS `Record Number`
    FROM desiredData
    """
    spark.sql(query).show
    
    val query2 = s"""
    SELECT ROW_NUMBER() OVER (PARTITION BY column1 ORDER BY column1, column2) AS column3
    FROM desiredData
    """
    spark.sql(query2).show
    .
    .
    .
    
  • 测试注意事项:
  • EMR:EMR-5.10.0,带清管器0.17.0、齐柏林飞艇0.7.3和火花2.2.0
  • MySQL:MariaDB 5.2.10
  • 工具书类
  • 阿帕奇蜂巢(不另作说明)。家。[在线]Cwiki.apache.org。可在以下网址查阅:[于2017年12月1日查阅]
  • 阿帕奇火花公司(n.d.)。与Apache Hive的兼容性。[在线]spark.apache.org。网址:​ [于2017年12月1日查阅]

    Spice SQL支持<代码> SQL:2003 和<代码> SQL:2011 < /代码> [ 1 ] [2 ],您可以考虑通过添加依赖性来通过Zelpin的火花来实现这一点。

  • 获取具有正确版本的mysql连接器
  • 将其添加为齐柏林飞艇上Spark解释器的依赖项。(我把罐子放在主机上)
  • 您现在应该能够访问MySQL表。以下是使用Scala API的示例:

    /* Database Configuration*/
    val jdbcURL = s"jdbc:mysql://${HOST}/${DATABASE}"
    val jdbcUsername = s"${USERNAME}"
    val jdbcPassword = s"${PASSWORD}"
    
    import java.util.Properties
    val connectionProperties = new Properties()
    connectionProperties.put("user", jdbcUsername)
    connectionProperties.put("password", jdbcPassword)
    connectionProperties.put("driver", "com.mysql.cj.jdbc.Driver")
    
    /* Read Data from MySQL */
    val desiredData = spark.read.jdbc(jdbcURL, "${TABLE NAME}", connectionProperties)
    desiredData.printSchema
    
    /* Data Manipulation */
    desiredData.createOrReplaceTempView("desiredData")
    val query = s"""
    SELECT COUNT(*) AS `Record Number`
    FROM desiredData
    """
    spark.sql(query).show
    
    val query2 = s"""
    SELECT ROW_NUMBER() OVER (PARTITION BY column1 ORDER BY column1, column2) AS column3
    FROM desiredData
    """
    spark.sql(query2).show
    .
    .
    .
    
  • 测试注意事项:
  • EMR:EMR-5.10.0,带清管器0.17.0、齐柏林飞艇0.7.3和火花2.2.0
  • MySQL:MariaDB 5.2.10
  • 工具书类
  • 阿帕奇蜂巢(不另作说明)。家。[在线]Cwiki.apache.org。可在以下网址查阅:[于2017年12月1日查阅]
  • 阿帕奇火花公司(n.d.)。与Apache Hive的兼容性。[在线]spark.apache.org。网址:​ [于2017年12月1日查阅]