使用SparkyR将数据从数据库传输到Spark_R_Apache Spark_Dataframe_Sparklyr - Fatal编程技术网

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/r/84.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/3/apache-spark/6.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
使用SparkyR将数据从数据库传输到Spark_R_Apache Spark_Dataframe_Sparklyr - Fatal编程技术网

使用SparkyR将数据从数据库传输到Spark

r apache-spark dataframe

使用SparkyR将数据从数据库传输到Spark,r,apache-spark,dataframe,sparklyr,R,Apache Spark,Dataframe,Sparklyr,我在数据库中有一些数据，我想在Spark中使用SparkyR处理这些数据我可以使用基于DBI的包将数据从数据库导入R dbconn <- dbConnect(<some connection args>) data_in_r <- dbReadTable(dbconn, "a table") dbconnSparklyr>=0.6.0 您可以使用spark\u read\u jdbc 0.6.0 我希望有一个更优雅的解决方案，但这里有一个使用低级API的最小示例：

我在数据库中有一些数据，我想在Spark中使用SparkyR处理这些数据

我可以使用基于DBI的包将数据从数据库导入R

dbconn <- dbConnect(<some connection args>)
data_in_r <- dbReadTable(dbconn, "a table")

dbconnSparklyr>=0.6.0
您可以使用spark\u read\u jdbc

0.6.0
我希望有一个更优雅的解决方案，但这里有一个使用低级API的最小示例：

确保Spark可以访问所需的JDBC驱动程序，例如通过将其坐标添加到Spark.jars.packages
。例如，对于PostgreSQL（针对当前版本进行调整），您可以添加：
spark.jars.packages org.postgresql:postgresql:9.4.1212

至SPARK\u HOME/conf/SPARK defaults.conf

加载数据并注册为临时视图：
name <- "foo"

spark_session(sc) %>% 
  invoke("read") %>% 
  # JDBC URL and table name
  invoke("option", "url", "jdbc:postgresql://host/database") %>% 
  invoke("option", "dbtable", "table") %>% 
  # Add optional credentials
  invoke("option", "user", "scott") %>%
  invoke("option", "password", "tiger") %>% 
  # Driver class, here for PostgreSQL
  invoke("option", "driver", "org.postgresql.Driver") %>% 
  # Read and register as a temporary view
  invoke("format", "jdbc") %>% 
  invoke("load") %>% 
  # Spark 2.x, registerTempTable in 1.x
  invoke("createOrReplaceTempView", name)


使用dplyr
加载临时视图：
dplyr::tbl(sc, name)


请务必阅读更多JDBC选项，重点是partitionColumn
、*Bound
和numPartitions

有关更多详细信息，请参见示例和

invoke("options", as.environment(list(
  user="scott", password="tiger", url="jdbc:..."
)))

dplyr::tbl(sc, name)

[apache spark]相关文章推荐

随机文章推荐

Collections 处理嵌套列表以生成图形数据 collections groovy

Collections “掷物”；收集被修改；枚举操作不能执行"；错误 collections

Collections 获取主干集合中的项目 collections backbone.js

Collections 在zend framework 2中，如何将字段集数据保存到数据库 collections zend-framework2

Collections 在solr中使用集合API在集合中添加碎片 collections solr

Collections 如何在TFS上列出项目集合？ collections tfs

Collections 在shopify中创建包含产品变体的集合 collections shopify

Collections 哈克朗—；Contindexaccess在Tk上保持不变有什么原因吗？上下文 collections

Collections 在这里，它不是一成不变的，因为key&；可以更改HashMap的值（字段值）。请建议使其成为真正的不可变类的解决方案 collections

Collections 将数据表中的列中的数据添加到Power Apps中的集合 collections powerbi

Collections 集合和数组之间是否存在集合超类型？如果不是，函数如何在集合和数组上都是多态的（用于迭代）？ collections julia

[r]相关推荐

Tags

Tkinter Glassfish Ios6 Data Structures Codenameone Validation Compiler Errors Jdbc Objective C Joomla Iframe Zend Framework2 Xslt Testing Smalltalk Leaflet Swing Assembly Delphi Ruby On Rails 3 Google Api Jquery Plugins Ssas Protractor Geometry Puppet Webstorm View Plsql Kibana C++ Llvm Prometheus Command Line Anaconda Amazon Cloudformation Bots Kubernetes Postman Cuda Dotnetnuke Sql Server 2008 R2 Routing Django Grid Blazor E Commerce Cucumber Routes Tcl Mariadb Gps Sails.js Applescript Powershell Twitter Bootstrap Iis Vbscript Encoding Video Streaming Google Colaboratory Angular6 Google Maps Google Apps Script Scripting Database Docusignapi Ftp Protocol Buffers Hazelcast Modelica Drupal 6 Imagemagick Date Jira Pandas Vector Eclipse Rcp Wordpress Visual Studio 2012 Isabelle Uiview Big O Visual Studio 2015 Codeigniter Path Struts2 Tags Hibernate Typo3 Shiny Ecmascript 6 Openshift Visual C++ Login Gdb Asp.net Mvc 2 Ipython Pine Script Netsuite Docker Architecture Phpmyadmin Opencl Jwt Internet Explorer Transactions Dom Acumatica Websphere Paypal Sed Phpunit Julia Elm Fullcalendar Apache Flex Graphql Jekyll Floating Point Gnuplot Multithreading Spring Mvc Computer Vision Redirect Ios Google Chrome Devtools Youtube Api Dynamics Crm 2011 Triggers Virtual Machine Jqgrid Azure Ad B2c Dask Xamarin.ios Collections Numpy Xamarin.android Coding Style Mips Clearcase Activemq Core Data Compilation Cocos2d X Silverlight 4.0 Vba Windows Memory Management Telegram User Interface Directx Sencha Touch 2 Axapta Windows 8 Symfony1 Ssis Jhipster Breeze Selenium Webdriver Karate Scroll Ruby Ubuntu Web Scraping Php Sonarqube Select Ip Xsd Nhibernate Spring Batch Unix Image Fluent Nhibernate Jenkins Sequelize.js Ignite Cypress Rally Csv Kotlin Process Sugarcrm Ajax Monitoring C++ Cli Selenium Oracle11g Firefox Addon Windows Phone Performance Jar Ios7 Input Amp Html Ada Macros Swiftui Junit Arm

Copyright © 2024. All Rights Reserved by - Fatal编程技术网