从pandas数据帧聚合随机样本并在空数据帧中迭代附加采样df平均值的更有效方法_Pandas_Dataframe_For Loop_Aggregate_Sampling - Fatal编程技术网

从pandas数据帧聚合随机样本并在空数据帧中迭代附加采样df平均值的更有效方法

pandas dataframe for-loop

从pandas数据帧聚合随机样本并在空数据帧中迭代附加采样df平均值的更有效方法,pandas,dataframe,for-loop,aggregate,sampling,Pandas,Dataframe,For Loop,Aggregate,Sampling,我试图从我的df中随机抽取一个样本，使用df_sample.mean（axis=0）获取单行序列中所有列的平均值，然后将这个序列附加到一个空数据帧，我想要100万行这样的行。我得到了结果，但运行时间太长了。有人能提出一个有效的方法吗 train = pd.DataFrame() for i in range (1000000): df_sample = df_2.sample(n=100) row = df_sample.mean(axis=0) train = t

我试图从我的df中随机抽取一个样本，使用df_sample.mean（axis=0）获取单行序列中所有列的平均值，然后将这个序列附加到一个空数据帧，我想要100万行这样的行。我得到了结果，但运行时间太长了。有人能提出一个有效的方法吗

train = pd.DataFrame()

for i in range (1000000):

    df_sample  = df_2.sample(n=100)
    row = df_sample.mean(axis=0)
    train = train.append(row,ignore_index=True)

这里有一个更快的方法，这将产生100万（1000万）行：

方法1：使用内置熊猫进行采样

n_times = 1000000 values = [df_2.sample(n=1).mean(axis=0, numeric_only=True) for _ in range (n_times)] train = pd.DataFrame(values, columns=['mean_col'])
方法2：使用numpy进行采样

def f1(): return np.mean(df_2.values[np.random.randint(0, df.shape[0])]) def f2(): return df_2.iloc[np.random.randint(0, df.shape[0])].mean(axis=0, numeric_only=True) values = [f1() for _ in range(n_times)] train = pd.DataFrame(values, columns=['mean_col']) values = [f2() for _ in range(n_times)] train = pd.DataFrame(values, columns=['mean_col'])

我很困惑。从dataframe中抽取100条记录，计算每行的平均值，这将为您提供100维列向量，然后将其作为一行附加到新的dataframe？这样做的目的是什么？获取具有连续变量的聚合数据集（因为均值）。我的原始数据集只有分类变量。所以，这就是为什么不是更快的方法，用的时间几乎相同

[dataframe]相关文章推荐

DataFrame-基于列子集计算的列 dataframe pandas

Dataframe 无法将NetCDF文件导入数据帧 dataframe pandas

GLM.jl中带有DataFrames.jl的分类数据的指标矩阵 dataframe julia

Dataframe 在pyspark中连接两个数据帧 dataframe pyspark

Dataframe 使用数据帧在Spark中使用数据差异（增量） dataframe apache-spark hadoop

Dataframe 有没有更好的方法在Python中查找摘要统计信息？ dataframe statistics

Dataframe ApacheSpark:计数vs人头（1）。我是空的 dataframe apache-spark

Dataframe 根据两列或多列中的条件删除行 dataframe

Dataframe Pyspark数据帧将条件添加到'reduce（add，（F.col（x）` 让我们考虑一个数据文件 df>代码>如下： df.show（） +-----+-----+-----+-----+-----+ |col A | val|u 1 | val|u 2 | val|u 3 | val|u 4| +-----+-----+-----+-----+-----+ |城市1 | 100 | 100 | 200 | 100| |城市2 | 200 | 300 | 300 | 100| |城市1 dataframe pyspark

Dataframe Pyspark数据帧比较 dataframe apache-spark pyspark

Dataframe 仅当数据帧中存在列时应用when条件 dataframe apache-spark

Dataframe 是否可以编写一个将函数名作为参数并将其应用于数据帧的包装器类？ dataframe pyspark

Dataframe 如何替换管道中缺少的值 dataframe julia

Dataframe SparkSQL超前/滞后函数中的动态/可变偏移 dataframe apache-spark

随机文章推荐

Scala swing 2.8如何设置滑块的背景色？ swing

Swing 动态JPanel加法 swing java

如何使用hssfTableUtil将JTable java swing/jidesoft单元格背景颜色导出到excel.xls文件 swing

Swing 将调度事件切换到多个级别的容器 swing events

Swing 摆动按钮按下 swing

如何验证输入到scala.swing.passwordfield中的密码？ swing scala passwords

特定的一个表头颜色java swing swing

滚动窗格的滚动条（其中有一个文本区域）在JavaSwingGUI中未正确显示 swing

Swing 为什么JScrollPane不会对鼠标滚轮事件做出反应？ swing events

Swing 这个方法调用EventDispatchThread做什么？ swing

Swing 如何在进程运行时释放GUI swing

Swing 双缓冲帧 swing

如何使用scala.swing listenTo订阅操作属性更改？ swing scala events properties

[pandas]相关推荐

Pandas 在OCaml中是否有数据帧的等价物？
Pandas Ocaml

在Pandas中构建条件时间序列数据透视表
Pandas

Pandas 使用包含词典列表的列
Pandas

Pandas '；numpy.ndarray和#x27；对象不可调用错误3
Pandas Numpy

Pandas 大熊猫对多个不规则采样事件的距离
Pandas

用pandas生成矩阵
Pandas Matrix

Pandas 熊猫圈的矢量化
Pandas Numpy

Pandas 将python日期列表解析为数据帧
Pandas Datetime

尝试基于多索引合并pandas中的2个数据帧
Pandas Dataframe Merge

Pandas 将数据帧中的任何字符串替换为nan
Pandas Dataframe

Pandas 我怎样才能使这段代码更地道呢？
Pandas

使用pandas连接具有不同列的2个多索引数据帧
Pandas Dataframe

Pandas 熊猫在数据帧中使用多行作为列多索引
Pandas Dataframe Indexing

Pandas 从不同类型的熊猫中删除异常值
Pandas Jupyter Notebook

Pandas 如何获取数据帧中特定列的模式值索引
Pandas Dataframe Indexing

Pandas 熊猫数据帧索引与其他列有何不同？
Pandas Dataframe Indexing

Pandas 如何在索引位于不同位置的熊猫中使用？
Pandas

Pandas 计算数据帧中每5行的平均和标准偏差
Pandas Dataframe

Pandas 基于指数的动态滚动窗口中最大落差和落差的确定
Pandas

Pandas 如何通过检查标志来查找值
Pandas

Pandas 逐组增长数据帧
Pandas Dataframe

Pandas 根据日期时间和今天创建一个新列'；熊猫的日期
Pandas

Pandas 用插值函数填充数据帧中的NaN
Pandas

Pandas 替换从中的另一列获取的字符串
Pandas Dataframe Replace

使用tensorflow加载pandas数据帧并使用单个实例进行预测
Pandas Dataframe Tensorflow Machine Learning Keras

Pandas 如何按类别绘制1d散点图/或在箱线图上添加点
Pandas Matplotlib

Pandas 增加matpplot中的x y值
Pandas Matplotlib

Pandas 计算熊猫中非数字列的平均值
Pandas

Pandas 从分组数据框中获取用户输入并绘制图形
Pandas Dataframe Csv Matplotlib

Pandas QT表格单元格编辑错误：仅整数、切片（`:`）、省略号（`…`）、numpy.newaxis（`None`）
Pandas

Tags

Msbuild Compiler Construction Network Programming Hybris Debugging Automation Cuda Eclipse Rcp Python 3.x String Install4j Sass Processing Push Notification Composer Php Computer Vision Variables Magento Socket.io Generics Character Encoding Cakephp Mapbox Model View Controller Jupyter Notebook Atom Editor Csv Webview Ios7 Laravel Swing Iphone Bots Cocos2d Iphone Oauth 2.0 Rabbitmq Google Visualization Silverlight Sip Pytorch Here Api Sed Virtualbox Android Ndk Maven 2 Odata Canvas Vb6 Prometheus Tkinter Replace Url Dependencies Migration E Commerce Gtk Windows 10 Stored Procedures Flash Antlr4 Cron Itext Apache Pig Woocommerce Content Management System Linux Kernel Jvm Xna Subsonic Input Awk Scikit Learn Command Line Windows 8 Firefox Addon Utf 8 Menu Haskell Php Gstreamer Ruby On Rails 3.1 Validation Nestjs Recursion Backbone.js Java 8 Web Scraping Ssis Notepad++ Maps Lua Swift Scroll Random Asterisk Modelica Xpath Project Management Playframework 2.0 Iis Centos Bison Google Drive Api Chart.js Linq To Sql Animation Button Reflection Kentico Continuous Integration Active Directory Memory Management Com Logic X86 Nsis C# 3.0 Netlogo Google Cloud Dataflow Acumatica Sqlalchemy Routing Mdx Syntax Visual C++ Android Studio Oop Jaxb Google Maps Api 3 Webpack Apache Azure Devops Cygwin Cookies File Editor Data Structures Ag Grid Security Glassfish Cluster Computing Design Patterns Plsql Layout Twilio Fullcalendar Google Apps Script Windbg Weblogic Url Rewriting Pagination Floating Point Powerbi C++11 Intellij Idea Pycharm Ftp Joomla Charts Opengl Rx Java Ember.js Ipad Makefile Sitecore Azure Autocomplete Google Colaboratory File Upload Calendar Numpy Seo Facebook Jwt Class Html Powershell Oracle10g Apache Spark Serialization Orm Installation Process Influxdb Octave Yaml Dart Wso2 Serial Port Ruby On Rails 4 C# Vba Common Lisp Oauth Visual Studio 2010 Gps Android Layout Google Chrome Wolfram Mathematica Select Gruntjs

Copyright © 2024. All Rights Reserved by - Fatal编程技术网