Python Dask计算非常慢_Python_Python 3.x_Performance_Dask_Dask Distributed - Fatal编程技术网

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/283.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python Dask计算非常慢_Python_Python 3.x_Performance_Dask_Dask Distributed - Fatal编程技术网

Python Dask计算非常慢

python python-3.x performance dask

Python Dask计算非常慢,python,python-3.x,performance,dask,dask-distributed,Python,Python 3.x,Performance,Dask,Dask Distributed,我有一个由500万条记录组成的数据框架。我试图通过利用python中的dask数据帧，使用下面的代码来处理它 import dask.dataframe as dd dask_df = dd.read_csv(fullPath) ............ for index , row in uniqueURLs.iterrows(): print(index); results = dask

我有一个由500万条记录组成的数据框架。我试图通过利用python中的dask数据帧，使用下面的代码来处理它

 import dask.dataframe as dd                                          
 dask_df = dd.read_csv(fullPath)
 ............
 for index , row in uniqueURLs.iterrows():
   print(index);
   results = dask_df[dask_df['URL'] == row['URL']]
   count = results.size.compute();

但我注意到dask在过滤数据帧方面非常有效，但在.compute（）中却没有。因此，如果我去掉计算结果大小的那一行，我的程序就会变得非常快。有人能解释一下吗？我怎样才能使它更快

但是我注意到dask在过滤数据帧方面非常有效，但是不在.compute（）中

您误解了

dask.dataframe

的工作原理。行

results=dask\u df[dask\u df['URL']==行['URL']]]

对数据集执行无计算。它只存储有关计算的指令，这些指令可以在以后触发
所有计算都只应用于行
count=results.size.compute（）
。这完全是意料之中的事，因为
dask
的工作效率很低
想象一个发电机和一个函数，比如
list
，它可以使发电机排气。生成器本身是惰性的，但在被函数调用时会触发操作有关更多信息，请参阅文档

[python 3.x]相关文章推荐

Python 3.x Dicttoxml模块标签 python-3.x

Python 3.x 如何重命名熊猫中的多组行？ python-3.x pandas numpy

Python 3.x 熊猫：如何以我想要的方式旋转/重塑数据帧（如果可能的话…） python-3.x pandas dataframe

Python 3.x “命令”；python setup.py egg“u info”；在中失败，错误代码为1 python-3.x

Python 3.x 从不均匀的字典列表创建数据帧 python-3.x pandas dictionary dataframe

Python 3.x Raspberry Pi 3 pyaduio未检测到任何设备 python-3.x

Python 3.x 如何在python中转换历元日期时间？ python-3.x datetime

Python 3.x TypeError:_request（）获取了意外的关键字参数'；饼干'；（aiohttp）随机输入导入异步导入json 进口aiohttp 导入系统导入URL库从lxml.html.soupparser导入解析从aiohttp导入客户端会话从线程导入线程 def ttest（）：异步def提取（url，会话）：标题={ “主机”：“example.com” } cookies2={ “测试”：“测试” } 数据=“{”测试“：“测试”}” 与session.post（u python-3.x

Python 3.x 如何从python中的dict列表创建dict of dict？ python-3.x dictionary

Python 3.x 当pyqt connect信号运行该功能时，无法更新按钮文本 python-3.x

Python 3.x 如何按顺序查找字符串（带布尔值）？ python-3.x

Python 3.x 如何将数据头和数据本身拆分为各自的列？ python-3.x pandas csv dataframe

Python 3.x 在Boto3中创建新连接时指定ConnectionProperties python-3.x amazon-web-services amazon-ec2

Python 3.x Pandas.str.extract无法处理字符串 python-3.x string pandas

Python 3.x 仅返回带有elemtree的特定标记 python-3.x xml

Python 3.x 为什么numpy将真正小的数字视为零？ python-3.x numpy

Python 3.x 在jupyter笔记本中，内核_和_输出函数的确切用途是什么？ python-3.x jupyter-notebook

Python 3.x Python多线程将执行时间增加了3倍，而不是减少 python-3.x multithreading optimization

Python 3.x SymPy：取消不必要的变量和系数 python-3.x

Python 3.x 我正试图在我的jetson nano上构建mediapipe python-3.x

随机文章推荐

Requirejs 当我第二次实例化视图时，视图事件被设置两次 requirejs

RequireJs——第一次尝试——似乎做不好 requirejs

RequireJS+；优化器包括在主文件上定义的模块 requirejs optimization

Requirejs 在bower_组件中定义供应商库自定义版本的正确方法是什么？ requirejs gruntjs

使用requireJS和预编译的把手模板加载翻译（i18next） requirejs

如何在Yeoman中生成支持RequireJS的Webapp？ requirejs

Requirejs 将Require.js与外部连接工具一起使用 requirejs

将EJS与requirejs一起使用 requirejs

typescript requireJS遇到递归加载错误-来自新调用 requirejs typescript

Requirejs 使用带有相对路径的require js模块 requirejs

RequireJS：如何从define方法返回匿名函数结果？ requirejs

Can'；“得不到”；“十字路口”；在typescript中作为requirejs AMD模块加载 requirejs typescript

Requirejs 网页包与amd模块集成 requirejs webpack

[python]相关推荐

Tags

Graphics Apache Flink Geometry Concurrency Unicode Twilio Hash Log4j Jasmine Amazon Redshift Artificial Intelligence Python Jasper Reports Indexing Centos Spring Shiny Jpa Keras Nlp Zend Framework2 Makefile Blockchain Sdk Tree Angular6 Jmeter Mfc System Verilog Ipython Magento2 Hybris Ios7 Dns Django Rest Framework Matplotlib Biztalk Karate Node.js Tcl Processing Parse Platform Cocoa Touch Google Calendar Api Typo3 Google Api Titanium Oracle Apex Arduino Testng Playframework 2.0 Highcharts Certificate Data Binding Python Sphinx Oracle10g Sql Server Database Design Ibm Mq Oauth 2.0 Google Sheets Kibana Sorting Filter Windows Phone 8.1 Kotlin Parameters Doctrine Orm Jquery Swing Stored Procedures Linux Kernel .net 4.0 Download Netbeans Acumatica Github Aframe Wcf Ruby On Rails Selenium Ionic2 Dart Sockets Servlets Dask Javascript Email Spotify Io Hyperlink Wxpython Orchardcms Ruby On Rails 3 Jakarta Ee Asp.net Core Mvc Here Api Logstash Curl Xamarin.ios Iis 7 Android Fragments Mongoose Continuous Integration Perforce Statistics Gmail Rxjs Batch File Sails.js List Jsf 2 Javafx Input Random Webrtc Types Filesystems Localization Mpi Tensorflow C++11 Openlayers Video Windows Phone 8 Identityserver4 Discord.js Uiview Office Js Iis Verilog Marklogic Sapui5 Serialization Jboss Opencv Mips Flutter Notepad++ Debugging Knockout.js Excel Formula Clang Gtk Binary Audio Qt Requirejs Gradle Arrays Visual Studio 2017 Google Cloud Platform Laravel 4 Openssl Sencha Touch Multithreading Networking Cmd Sql Rdf Flask User Interface Automation Coq Symfony1 Serial Port Validation Selenium Webdriver Jms Workflow Apache Spark Smalltalk Coldfusion Neo4j Https Http Graphviz Jaxb Post Sublimetext3 Json Pointers Ajax Python 3.x Visual Studio 2015 Office365 Charts Markdown Csv Web Crawler Amazon Web Services Datetime Pentaho Modelica Corda Macros Sas Robotframework Scheme Ecmascript 6 Discord.py

Copyright © 2024. All Rights Reserved by - Fatal编程技术网