Pyspark-如何复制/复制行？_Pyspark_Row_Explode - Fatal编程技术网

Pyspark-如何复制/复制行？

pyspark

Pyspark-如何复制/复制行？,pyspark,row,explode,Pyspark,Row,Explode,我需要从数据帧中“克隆”或“复制”/“复制”每一行我什么也没发现，我只知道我需要使用explode 例如： ID - Name 1 John 2 Maria 3 Charles 输出： ID - Name 1 John 1 John 2 Maria 2 Maria 3 Charles 3 Charles 谢谢您可以使用数组重复和分解（Spark2.4+）对于重复的： from pyspark.sql import f

我需要从数据帧中“克隆”或“复制”/“复制”每一行

我什么也没发现，我只知道我需要使用explode

例如：

ID - Name
1     John
2     Maria
3     Charles

输出：

ID - Name
1     John
1     John
2     Maria
2     Maria
3     Charles
3     Charles

谢谢

您可以使用数组重复
和分解
（Spark2.4+）
对于重复的： from pyspark.sql import functions as F df.withColumn("Name", F.explode(F.array_repeat("Name",2))) df.withColumn("Name", F.explode(F.array_repeat("Name",3))) 对于一式三份： from pyspark.sql import functions as F df.withColumn("Name", F.explode(F.array_repeat("Name",2))) df.withColumn("Name", F.explode(F.array_repeat("Name",3))) 你为什么不把数据框本身加起来呢？嘿@Mohammad，你知道在给定条件下，行数是否可以相乘吗？例如，有一个支持列的数字是2,4,6，我想相应地分解成这些数字。你的spark版本是什么？并支持具有2,4,6含义的列，复制2次，4次，6次，对吗？这意味着我无法修复此参数2,4,6，它应该是读像df.withColumn（“Name”，F.explode（F.array_repeat（“Name”，F.col（“parameter”））这样的列的内容@thalesthales你检查过我的更新吗？。保持它动态的唯一方法是使用表达式，并发送参数的int值，如df.withColumn（“Name”，F.explore（F.expr（“array_repeat（Name，int（parameter））”）”） from pyspark.sql import functions as F df.withColumn("Name", F.expr("""repeat(concat(Name,','),Support)"""))\ .withColumn("Name", F.explode(F.expr("""split(substring(Name,1,length(Name)-1),',')"""))).show()

[cookies]相关文章推荐 Cookies HttpWebRequestCookie古怪 cookies Cookies 网络信标（网络bug）是如何工作的？ cookiesweb Cookies 如何从此cookie中提取登录信息？ cookieshashyoutube Cookies “；预期令牌不存在”；我的Apache日志中出现错误 cookiesapache2 Cookies 设置Tomcat 7 sessionid和值，以便通过会话亲和性的硬件负载平衡进行标识 cookies Cookies 饼干存放在哪里？ cookies Cookies 当我卷曲曲奇时会发生什么 cookiescurl Cookies 一些饼干可以玩！用err_empty_回答 cookiesplayframework-2.0 Cookies 以F#方式将设置Cookie字符串转换为记录？ cookiesf# Cookies 如何保存使用MCV5/OWIN更新的Cookie声明 cookiesasp.net-mvc-5 Cookies 如果我使用SSL，是否需要对Cookie进行签名/加密？ cookiesencryption Cookies 从html页面移动到perl页面时未保留Cookie cookiesweb Cookies 使用ASP.NET标识2防止外部登录重定向写入Cookie cookiesoauth-2.0 Cookies Varnish：如何基于cookie更改站点的语言？ cookies Cookies 雅虎财经历史数据下载器url不工作 cookies Cookies 从邮递员拦截器中提取cookie cookiespostman Cookies Nuxt.js并将cookie转发到后端 cookies Cookies 无法在clojure环中设置cookie cookiesclojure 如何使Shopware 5 csrf和cookies在iframe中工作？ cookies 随机文章推荐 Amazon redshift 从redshift卸载到s3（带标题） amazon-redshift Amazon redshift 如何在Amazon Redshift中获取用户创建时间戳 amazon-redshift Amazon redshift 将一行的值分散到红移表中的多个列上？ amazon-redshift Amazon redshift 如何在Amazon红移SQL中生成连续整数表？ amazon-redshift Amazon redshift 获取两个日期的营业时间差（红移） amazon-redshift Amazon redshift 无法从AWS红移访问AWS Athena表 amazon-redshift Amazon redshift 使用红移的Ignoreheader CSV文件 amazon-redshift Amazon redshift 红移到_日期问题：日期格式无效；指定日期两次 amazon-redshift

[pyspark]相关推荐 Pyspark Spark流处理二进制数据文件 Pyspark Pyspark 利用Spark和DataFrames计算积分 Pyspark 使用整数与十进制值在Pyspark中进行过滤 Pyspark 使用pyspark将Json数据加载到hbase Pyspark Hbase 获得；无效语法"；使用pyspark从文本文件读取数据时出错 Pyspark Spark的快速数字哈希函数（PySpark） Pyspark 使用Pyspark将列从字符串转换为时间戳 Pyspark 如何在Pyspark中将Int列转换为字符串？ Pyspark 如何从pyspark dataframe的schema属性（从拼花文件）获取特定字段名的数据类型？ Pyspark pyspark中部分数据帧的聚合 Pyspark pyspark中的异或逻辑条件 Pyspark 如何在PySpark中读取检查点数据帧 Pyspark Pyspark 用条件求和 Pyspark Pyspark 将RESTAPI获取方法响应另存为json文档 Pyspark Pyspark 基于来自第二个数据帧的匹配键将列表附加到Spark数据帧列 Pyspark Pyspark 分类变量的矢量索引器或OneHotEncoder？ Pyspark 如何计算pyspark数据帧中值的条件概率？ Pyspark PYSPARK：将前导零与条件相加 Pyspark 为导入到pyspark的s3文件设置条件 Pyspark 将HDFS上一个文件夹中的许多逗号删除文件加载到pyspark数据帧中，第一个文件有头 Pyspark 如何利用ApachePySpark中roc_曲线生成的阈值计算精确召回率 Pyspark 如果pyspark中两列中的任何一列中的行具有相同的值，如何为数据帧创建唯一ID Pyspark Tags Cloud Foundry Groovy Passwords Logging Asp.net Unit Testing Twitter Bootstrap 3 Odata Pagination Testing Google Plus Pip Ocaml Ruby Next.js Graph Timer Autocomplete Azure Cosmosdb Gis E Commerce Notepad++ Parallel Processing Three.js Jsf Continuous Integration Serialization Automated Tests Cron Jsf 2 Sql Server 2008 R2 Entity Framework 4 Sonarqube Here Api Wordpress Jsp Concurrency Dynamics Crm 2011 Glassfish Windows Phone Vim Abap Windows 8 Eclipse Cluster Computing Azure Sharepoint 2013 Jira Matlab Report Vue.js Rally Content Management System Swagger Magento2 C++ Mapreduce Grep X86 Compression Breeze Stored Procedures For Loop Go Jdbc Rdf Msbuild Cordova Cucumber Properties Pine Script Tfs Devexpress Clang Sharepoint 2010 Unicode Tableau Api Gitlab Autodesk Forge Types Html Text Symfony1 Typo3 Couchdb Amp Html Crystal Reports Couchbase Openerp Amazon Dynamodb Oracle Floating Point Mediawiki Nuget Axapta D3.js Yaml Xslt Dll Tomcat Encoding Push Notification Mono Events Reference Ckeditor Highcharts Sharepoint Odoo Openssl Ios7 Github Drop Down Menu Azure Service Fabric Cloud Opencl Vuejs2 Winapi Triggers Machine Learning Ffmpeg Pycharm Memory Management Encryption Visual Studio 2013 Ibm Midrange Doxygen Reflection Django Rest Framework Checkbox Excel Spring Batch Network Programming Svg .net Core Cmd Spring Karate Cocoa Cmake Keyboard Delphi Drupal 6 Programming Languages Vb6 Embedded Command Line Animation Apache Numpy Symfony Airflow Download Keycloak Gcc Ip Azure Active Directory Hyperlink Log4j Iphone Ssrs 2008 Pyspark Methods Date Google Chrome Extension Spring Security Elm Computer Vision Configuration Quickbooks Jquery Parse Platform Windows Runtime Shell Sockets Asp.net Mvc Excel Formula Jasper Reports Login Ms Word Xsd Tags Ruby On Rails 3.1 Youtube Ios8 Blazor Mobile Python Objective C Signalr Tcl Ios Testng Keras Jqgrid Oracle10g Sqlalchemy Azure Devops F# Plot Aurelia

Copyright © 2024. All Rights Reserved by - Fatal编程技术网