Warning: file_get_contents(/data/phpspider/zhask/data//catemap/3/apache-spark/6.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Apache spark 库杜嵌套域_Apache Spark_Nested_Apache Kudu - Fatal编程技术网

Apache spark 库杜嵌套域

Apache spark 库杜嵌套域,apache-spark,nested,apache-kudu,Apache Spark,Nested,Apache Kudu,我对嵌套字段的Kudu有疑问 我有来自卡夫卡的JSON,如下所示: { "ts": 32, "status": "success", "uid": "3232", "url": "http://some_url", "syncpixel": "http://some_url", "dfp": { "DFP_UABrowser": "Chrome 61", "DFP_UAOperatingSystem": "Windows 7 ver.7.0", "

我对嵌套字段的Kudu有疑问

我有来自卡夫卡的JSON,如下所示:

{
  "ts": 32,
  "status": "success",
  "uid": "3232",
  "url": "http://some_url",
  "syncpixel": "http://some_url",
  "dfp": {
    "DFP_UABrowser": "Chrome 61",
    "DFP_UAOperatingSystem": "Windows 7 ver.7.0",
    "JavascriptDisplayData_Screen_W_x_H": "1440 x 900",
    "Native_client": true
  }
}
dfp
字段有一个嵌套对象,我想通过Flume将此对象插入kudu

我知道kudu不支持嵌套字段,并且支持二进制列。 我需要做什么

  • 将字段
    dfp
    转换为二进制格式并读取scala spark
  • 将JSON转换为扁平格式(但在许多情况下并不是最好的问题,比如在页面中使用产品id、名称和其他或产品视图购买流式产品)

  • 如果您使用spark/scala流媒体,则在正确设置集群时,不会出现问题。 通过spark读取整个json,并使用“explode”函数将json展平。
    这将使生活更轻松。

    如果使用spark/scala流媒体,则在正确设置群集后,将不会出现问题。 通过spark读取整个json,并使用“explode”函数将json展平。
    这将使生活更轻松。

    Impala无法使用VARCHAR或嵌套类型列创建Kudu表。Impala无法使用VARCHAR或嵌套类型列创建Kudu表。但这不是问题的答案。但这不是问题的答案。