Spark:Hive查询_Hive_Apache Spark_Hiveql_Apache Spark Sql_Parquet - Fatal编程技术网

Spark:Hive查询

hive apache-spark

Spark:Hive查询,hive,apache-spark,hiveql,apache-spark-sql,parquet,Hive,Apache Spark,Hiveql,Apache Spark Sql,Parquet,我有一个日志文件，第一列是配置单元表中的分区 logSchemaRDD.registerTempTable("logs") hiveContext.sql("insert overwrite table logs_parquet PARTITION(create_date=select ? from logs) select * from logs") 如何构造查询以选择第一列（此处标记为？并确保我在分区中选择的一列与第二列select（*）匹配？您需要显式地枚举源列表和目标

我有一个日志文件，第一列是配置单元表中的分区

    logSchemaRDD.registerTempTable("logs")

    hiveContext.sql("insert overwrite table logs_parquet PARTITION(create_date=select ? from logs) select * from logs")

如何构造查询以选择第一列（此处标记为？并确保我在分区中选择的一列与第二列select（*）匹配？

您需要显式地枚举源列表和目标列表中的列：在这种情况下，select*是不够的

insert overwrite table logs_parquet PARTITION(create_date) (col2, col3..) 
select col2,col3, .. col1 from logs

是的，编写查询需要做更多的工作，但是分区查询确实需要列与分区列最后一列的显式映射

[apache spark]相关文章推荐

Apache spark 使用Kafka direct stream消除纱线上的堆内存泄漏 apache-spark

Apache spark 使用独立Spark群集上的Spark Job Server增加缓存RDD（数据帧）上的查询并行能力 apache-spark

Apache spark Mesos上的Apache Spark:初始作业未接受任何资源 apache-spark

Apache spark 如何在executor中获取spark广播变量？火花芯 apache-spark

Apache spark 应用程序尝试appattempt_***不'；不存在于ApplicationMasterService缓存中 apache-spark

Apache spark 在Spark中将数据转换为拼花地板 apache-spark

Apache spark 如何从UI'；什么是舞台达格？ apache-spark

Apache spark 如果列名包含空格，DataFrame能否转换为case类的Dataset？ apache-spark

Apache spark 如何为spark shell中的spark启用配置单元支持（spark 2.1.1） apache-spark hive

Apache spark 超出Spark GC开销限制错误消息 apache-spark

Apache spark 将Spark数据帧写入CSV apache-spark

Apache spark 如何使用SparkSQL根据多个条件选择Spark DF中的行 apache-spark pyspark

Apache spark 火花窗功能：每帧/范围计算一次？ apache-spark

Apache spark 如何根据位置（而不是值）删除Spark数据帧中的几行？ apache-spark pyspark

Apache spark 如何对相同元素的列中的值进行计数 apache-spark pyspark

Apache spark 火花中的广播变量是否移动到纱线中的每个执行器或节点管理器？ apache-spark

Apache spark 如何连接数据帧列pyspark？ apache-spark pyspark

Apache spark 无法反序列化批次中具有不同项数的PairRDD apache-spark pyspark jupyter-notebook

Apache spark pySpark v3.0.1的图形框架 apache-spark pyspark

Apache spark Pyspark将字符串转换为包含两种不同格式的日期时间戳列 apache-spark pyspark

随机文章推荐

如何在MVVM中处理更改跟踪？ mvvm

MVVM模式下WP7应用程序中视图的关键是什么？ mvvm

如何在一个窗口中创建虚拟机之间的MVVM父/子关系？ mvvm

在MVVM中加载LongListSelector mvvm windows-phone-7

控件文本的MVVM绑定 mvvm

如何使用MVVM通过WPF应用程序实现Specflow mvvm

MVVM事件命令 mvvm

Mvvm ViewModel到Model使用ExpressMapper列表<；对象>；列出<；模型>；as场 mvvm mapping

FreshMvvm-PopPageModel在Android上不起作用 mvvm xamarin.forms

Mvvm 在使用Dagger时，我们真的需要ViewModelFactorys和viewmodelProviders吗？ mvvm

Mvvm SwiftUI:视图模型不更新视图 mvvm swiftui

[hive]相关推荐

如何在HIVE中获得zip输出结果，我正在使用putty
Hive

Hive 配置单元查询执行错误，MapredLocalTask返回代码3
Hive

Hive 提高配置单元中的写入性能
Hive Apache Spark

Hive 配置单元：Select*命令的工作方式与RDBMS不同
Hive

Hive 访问上的数据时发生Oracle BigData错误
Hive

获取星期几的HiveQL是什么？
Hive

Hive systate（）/current_date（）在HQL中不工作
Hive

Hive Hortonworks蜂巢和SpagoBI
Hive

Hive 配置单元UDF以从列表生成所有可能的有序组合
Hive

Hive 包含加载数据的配置单元脚本在oozie中不工作
Hive

如何在Hive中以严格模式实现笛卡尔积联接？
Hive

Hive 没有可用的数据库。权限可能丢失
Hive

Hive 如何检查列是否为字符串
Hive

Hive 如何让apache使用Jinja呈现配置单元HQL${variables}
Hive Airflow

Hive 配置单元表加载：无法移动源文件
Hive

Hive 在原始和复杂数据类型的配置单元表中插入值
Hive

Hive 在配置单元中将列数据分离为多个列
Hive

Hive 选择另一个表中不存在的列sql中的多个列
Hive

Hive 蜂窝LLAP低Vcore分配
Hive

Hive 从配置单元表中删除分区是否会删除它'；什么是分区？
Hive

Hive 配置单元如何选择除一列以外的所有列？
Hive

Hive 通过pyodbc访问配置单元获取ParseException并附加EOF
Hive

Hive 支持Flyway蜂巢？
Hive

Hive 在配置单元中加载预分区数据以供用户使用
Hive

Tags

Canvas Scala Reactjs Elixir Button Markdown Ffmpeg Javascript Google Sheets Excel Formula Swiftui Redux Deep Learning .net 4.0 Web Scraping Vhdl Debian Azure Devops Angular Google Maps Api 3 Gatsby Outlook Data Structures Filesystems Continuous Integration Seo Yii Ember.js Multithreading Cookies Postman Video Doctrine Laravel 4 Html Highcharts Version Control Parse Platform Tomcat Plone Postgresql Sprite Kit Geolocation Rspec Udp Post Serial Port Oauth 2.0 Wso2 Resharper Magento2 Windows Phone Couchbase String Macos Silverstripe C Servlets Google Calendar Api Entity Framework Core Ibm Cloud Ssrs 2008 Documentation Tabs Matrix EmptyTag Replace Hazelcast Pip Streaming Ruby On Rails 3.2 Encoding Layout Backbone.js Swagger Checkbox Mono Yii2 Xamarin.forms Erlang Statistics Phpmyadmin Project Management Pdf Graph Nest Url Rewriting Mips Opencl Doxygen Corda Antlr4 Robotframework Awk Typescript Google App Maker Jms Plot Unix Ant Scroll Rx Java Anaconda Stream Import Indexing Menu Google Cloud Firestore Pagination Ip Graphics Perforce Bots Model View Controller Nuget Jpa Windows Store Apps Jwt Orchardcms Ibm Midrange Triggers Jhipster Zend Framework2 Puppet .htaccess Raspberry Pi Domain Driven Design Stm32 Fortran Cocoa Gstreamer Jekyll Ipython Powerbi Latex Spring Navigation Web Applications Oracle Cuda Linq Html5 Canvas Azure Service Fabric Sharepoint Boost Bison Internationalization System Verilog Flash Knockout.js File Magento Compilation Jquery Ui Polymer Webgl Text Cloud Foundry Logstash Fullcalendar Xslt Air Mediawiki Azure Ad B2c Testng Flutter Selenium Asp Classic Ide Uitableview Pycharm Xpages Primefaces Scripting Spring Cloud Css Programming Languages Graphviz Glsl Certificate Google Visualization Wicket Llvm Drupal Asynchronous Properties Glassfish Omnet++ Configuration Performance Ssl F# Gdb Ignite Sql Server Discord.js Compiler Construction Object Breeze Amp Html Vector

Copyright © 2024. All Rights Reserved by - Fatal编程技术网