Apache spark 无法将聚合数据放入内存_Apache Spark_Pyspark - Fatal编程技术网

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/3/apache-spark/6.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Apache spark 无法将聚合数据放入内存_Apache Spark_Pyspark - Fatal编程技术网

Apache spark 无法将聚合数据放入内存

apache-spark pyspark

Apache spark 无法将聚合数据放入内存,apache-spark,pyspark,Apache Spark,Pyspark,我想将聚合数据放入内存，但出现错误。有什么建议吗 orders=spark.read.json（“/user/order\u items\u json”） df_2=订单。其中（“订单项目订单id==2”）.groupby（“订单项目订单id”） df_2.持久化（仅限StorageLevel.MEMORY_）** 回溯（最近一次呼叫最后一次）：文件“”，第1行，在 AttributeError:“GroupedData”对象没有属性“persist”Spark要求对分组数据使用聚合表达式如

我想将聚合数据放入内存，但出现错误。有什么建议吗

orders=spark.read.json（“/user/order\u items\u json”）

df_2=订单。其中（“订单项目订单id==2”）.groupby（“订单项目订单id”）

df_2.持久化（仅限StorageLevel.MEMORY_）**

回溯（最近一次呼叫最后一次）：文件“”，第1行，在

AttributeError:“GroupedData”对象没有属性“persist”

Spark要求对分组数据使用聚合表达式

如果您不需要对分组数据进行任何聚合，那么我们可以先进行一些虚拟聚合，如，计数…等，然后从
中删除列。选择如下所示的： import pyspark df_2 = orders.where("order_item_order_id == 2").groupby("order_item_order_id").agg(first(lit("1"))).select("order_item_order_id") #or df_2 = orders.where("order_item_order_id == 2").groupby("order_item_order_id").count().select("order_item_order_id") df_2.persist(pyspark.StorageLevel.MEMORY_ONLY) 非常感谢你…我也意识到我错过了功能。。。。非常感谢您的及时回复。你好，舒，我不知道我需要点击哪里来关闭此线程。

[pyspark]相关文章推荐 Pyspark 运行apachesystemml pyspark pyspark ImageSchema.toNDArray引发AttributeError:'；非类型'；对象没有属性'_jvm'； pyspark pyspark sql:AttributeError:“非类型”对象没有属性“联接” def主输入、输出： sdf=spark.read.csvinput，schema=observation\u schema sdf.RegisterEmptable'filtertable' 结果=spark.sql 在qflag为空的filtertable中选择* 显示 temp_max=spark.sql从filtertable中选择日期、站点、值，其中观测值='TMAX'。显示 temp_min=spark.sq pyspark Pyspark 从Databricks笔记本连接到Azure SQL数据库 pysparkazure-sql-database Pyspark 我对具有多个匹配项的正则表达式提取有问题 pyspark 无法在pyspark中使用.show（）显示数据帧 pyspark 使用pyspark洗牌随机选择的列 pyspark Pyspark 获取上个月的值 pyspark Pyspark中转置数据帧的通用解决方案 pyspark Pyspark 不使用AAD应用程序的Pyto连接器 pyspark 使用pySpark将hdfs中的零件文件读取到数据帧中 pyspark pyspark：自动填充隐式缺失值 pyspark Pyspark 通过使用凭证传递的Azure Datatricks中的python脚本查找Azure Datalake中文件/文件夹的上次修改时间戳 pyspark Pyspark 从日期获取周开始日期和周结束日期 pyspark Pyspark-设置本地核心和应用程序名称，并使用UTC作为时区 pyspark Pyspark 如何在SQL语句中将spark数据框用作表 pyspark 随机文章推荐 Jupyter notebook 如何将IPython v3笔记本转换为Jupyter v4？ jupyter-notebook Jupyter notebook 从IPython 5.x升级到6.0会由于IPython.utils.warn而导致崩溃 jupyter-notebook Jupyter notebook Jupyter笔记本无代码保存为PDF jupyter-notebook Jupyter notebook OSError:[WinError 193]%1不是win10中有效的Win32 application-python3（64位） jupyter-notebookanaconda Jupyter notebook 如何将带有python和js组件的nbextension作为labextension安装 jupyter-notebook Jupyter notebook 从IJulia输出中删除科学符号？ jupyter-notebookjulia Jupyter notebook 当工作区配置为在VNET中时，是否支持创建集成的notebookVM？ jupyter-notebook Jupyter notebook 我的jupyter笔记本没有'；我不能再执行代码了 jupyter-notebookanaconda Jupyter notebook 通过cmd行将conda环境添加到jupyter不会'；行不通 jupyter-notebook Jupyter notebook IPython：将HTML转换为图像 jupyter-notebookipython Jupyter notebook PyCaret-如何在Spyder中获得与Jupyter笔记本相似的输出 jupyter-notebook Jupyter notebook Azure Data Studio图表显示错误。怎么能修好呢？ jupyter-notebook

[apache spark]相关推荐 Tags Asp.net Mvc 4 Opencart Macos Encoding Octave Linkedin Primefaces Url Doctrine Gps Sql Server 2008 R2 Lisp Twig Safari Eclipse Rcp Nosql Dom Office365 Workflow Ibm Midrange Xml Asterisk User Interface Ruby On Rails 3.1 Mercurial Jsp Go Sapui5 Junit Windows 7 Sharepoint 2013 Dialogflow Es Sql Server 2008 Computer Science Memory Gmail Jasper Reports Bluetooth Domain Driven Design Web Crawler Ruby On Rails Google Analytics Assembly Apache Storm Ftp Xampp Jira Asp Classic Actions On Google Android Emulator Transactions Ssrs 2008 Editor Azure Cosmosdb Stored Procedures Jsf Sms Web Services Nunit Tkinter Composer Php Kubernetes Mariadb Linux Coding Style Jms Mongodb Responsive Design Vector Prometheus Cocoa Visual Studio 2013 Android Shell Xamarin.forms Google Drive Api Sql Dependencies Model Protocol Buffers Fluent Nhibernate Jvm Virtual Machine Module Stream Terraform Sql Server C# Antlr4 Sphinx Botframework Sugarcrm Project Management Ms Access Knockout.js Kendo Ui Plone Zsh Jdbc Fortran Azure Active Directory Time Complexity Yocto Listview Yii Spring Integration Dotnetnuke Express Vhdl Couchbase Graphviz Xamarin.ios Ffmpeg Google Cloud Dataflow Ethereum Pointers Logging Tree Visual Studio Code Silverlight Laravel 5 Shopify Numpy Iphone Events Apache Pig Python 2.7 React Native Batch File Acumatica Fonts Amazon Dynamodb Facebook Common Lisp Cmake Sails.js Spotify Testing Emacs Windows Phone 7 Oauth Interface Testng Symfony Unicode Google Visualization Sas Spring Mvc Office Js Logstash Parse Platform Rally Microsoft Graph Api Dynamics Crm Oracle Apex Opengl Es Uiview Function Sdk Firefox Gulp Hazelcast Phpstorm Artifactory Wcf Scikit Learn Kotlin Cypress Swift If Statement Arangodb Permissions Gstreamer Vbscript Javafx 2 Sencha Touch Appium Glsl Combobox Isabelle Forms Continuous Integration Selenium Webdriver Socket.io Amazon Ec2 Amazon Cloudformation Erlang Jakarta Ee Google Chrome Devtools Doxygen C Nginx Doctrine Orm Zend Framework Import Aurelia Neo4j Canvas Reference Input Ag Grid

Copyright © 2024. All Rights Reserved by - Fatal编程技术网