Python Gensim LdaMulticore无法正确进行多处理（仅使用4个工人）_Python_Lda_Gensim_Topic Modeling - Fatal编程技术网

Python Gensim LdaMulticore无法正确进行多处理（仅使用4个工人）

python

Python Gensim LdaMulticore无法正确进行多处理（仅使用4个工人）,python,lda,gensim,topic-modeling,Python,Lda,Gensim,Topic Modeling,我正在使用Gensim的LDA多核执行LDA。我有大约2800万个小文档（每个大约100个字符）我给工人们的理由是20，但顶部显示它只使用了4个过程。有一些讨论认为它在阅读语料库时可能会很慢，比如：但他们都使用MMC语料库。虽然我的语料库完全在记忆中。我有一台内存非常大（250GB）的机器，在内存中加载语料库大约需要40GB。但即使在那之后，LDAMulticore也只使用了4个进程。我将语料库创建为： corpus=[dictionary.doc2bow（text）表示文本中的文本] 我

我正在使用Gensim的LDA多核执行LDA。我有大约2800万个小文档（每个大约100个字符）

我给工人们的理由是20，但顶部显示它只使用了4个过程。有一些讨论认为它在阅读语料库时可能会很慢，比如：

但他们都使用MMC语料库。虽然我的语料库完全在记忆中。我有一台内存非常大（250GB）的机器，在内存中加载语料库大约需要40GB。但即使在那之后，LDAMulticore也只使用了4个进程。我将语料库创建为：

corpus=[dictionary.doc2bow（text）表示文本中的文本]

我无法理解这里的限制因素是什么？

我会检查您使用的批量大小
我发现，如果批次X n_工人大于文档数，我无法利用所有可用工人。这是有意义的，因为您每次传递给每个工人一个文档数。如果不考虑批处理值，您可能会“饿死”其中的一些

我不确定它是否解决了您的具体问题，但这确实是许多人提到多核在多处理方面没有像预期的那样“工作”的原因。在“在该节点上使用串行LDA版本”一行之后，记录器将变为静默状态。当在带有vecLib的Mac上运行时，我遇到类似问题。我用OpenBLAS解决了这个问题。不确定是否与此相关（BLAS库和多线程在平台上的工作方式）。

[sap]相关文章推荐

Sap 将报表从Deski转换为Webi时出错很多 sap

SAP HANA javascript部署 sap

Sap 大规模用户锁定/解锁 sap

随机文章推荐

Glsl 变暗四边形以模拟AO glsl

（未使用的）GLSL制服/输入/输出是否有助于调节压力？ glsl

Glsl 使用模拟着色器时的随机速度 glsl webgl

glslsandbox.com中的表面位置变化是什么 glsl

Glsl 函数添加与alpha的混合 glsl

Glsl OpenFL-为着色器提供时间 glsl

Glsl 产生辉光效果-alpha值存在问题 glsl

Glsl 在这种情况下，我应该在片段着色器中编写逻辑吗？ glsl webgl

[python]相关推荐

Python django将models.DecimalField与表单结合起来->；错误：量化结果对于当前上下文的位数太多
Python Django

Python 通过http停止cherrypy服务器
Python

python模块的单元测试基础架构
Python Unit Testing

Python 仅当模块不'；不存在
Python Module

Python SQLAlchemy中的PostgreSQL多维数组
Python Sqlalchemy

在Python中将SQL转换为json
Python Sql Json

Python 预签名URL和x-amz-acl
Python Amazon Web Services Amazon S3

Python 从numpy数组创建pydicom文件
Python

python中|=的用例
Python

自动将其转换为Python加密/解密
Python

Crontab |缺少Python模块
Python

Python 从字典列表中获取值列表？
Python List Dictionary

python中作用域和名称空间之间的区别？
Python

绘制凹凸图的Python方法
Python Charts

如何使用Python在Spark中添加两个稀疏向量
Python Apache Spark

python只记录到文件
Python Logging

在pypi.python.org上，什么会导致显式搜索返回隐藏的旧版本
Python

Python 如何在不使用密码的情况下连接到MySQL？（PyMySQL）
Python Mysql

如何使用python套接字获取html页面
Python Sockets Networking

Python drawContour不'；t工作OpenCV 3.4
Python Opencv

Python &引用；内核死机，正在重新启动；在spyder、jupyter和atom中不工作的代码中
Python Kernel

Python 表格无效
Python Django

Python 我想建立Simplechan？
Python Linux Postgresql Ubuntu Virtualbox

使用my python函数获取完整数据时出错？
Python Api

Python 无法使用google vision api获取ocr文本
Python Google Api

Python，原始输入列表列表
Python List Grid

python队列可以访问队列上等待的所有进程吗？
Python

Python Keras：在添加噪音后进行分离训练和测试不起作用
Python Keras Deep Learning

Python 如何使用matplotlib可视化dataframe的每个实例？
Python Pandas Matplotlib

错误消息，表示变量未定义。python
Python Function

Tags

Spring Integration Cocoa Touch Ms Office Phantomjs Angular Material Prestashop Sqlite Networking Activemq Linux Pyspark Iis 7 Vmware Typo3 C# 3.0 Ms Access Pentaho Django Rest Framework Composer Php Datetime Asterisk Apache Spark Opencart Extjs4 Hbase Directx Jmeter Meteor Web Applications Dart Codeigniter Error Handling Socket.io Devexpress Java Me Kendo Ui Workflow Gnuplot Google Cloud Firestore Deployment Math Computer Vision Tinymce Pip Actionscript 3 Delphi Windows Phone 7 Google Cloud Dataflow Report Markdown Apache Kafka Stm32 Session Openlayers Orm Amp Html Sphinx Import Drools Snmp Single Sign On Windows Nosql Vbscript Elm Mongoose Sails.js Excel Formula Triggers Llvm Instagram Asp.net Google Visualization Enums Visual Studio Webrtc Ecmascript 6 Rust Sip Leaflet Firefox Addon Dynamics Crm 2011 Outlook Exception Virtual Machine List Uml Applescript Google Chrome Devtools Intellij Idea Jar Layout Android Layout Flask Backbone.js Xampp Xmpp Certificate Ubuntu Titanium Xpath Plot Sencha Touch Json Sml Usb Maps Highcharts Protocol Buffers Ant Opengl Es Udp Permissions Service Recursion Umbraco Silverstripe Perforce Tabs Artifactory Youtube Api Gridview Google Maps Sas Teamcity Notepad++ Tags Unix Ios6 Ms Word Apache2 Xcode4 Objective C Laravel 4 Ldap Twitter Ibm Midrange Sublimetext2 Orientdb Erlang Vaadin Sublimetext3 Sql Server Couchbase Terminal Asp.net Core Mvc Mips Pointers Swift2 Jestjs Asp.net Mvc 2 Scala Openerp Wso2 Tridion Kotlin Visual Studio 2015 Amazon Web Services Clang Batch File Google App Engine Sql Server 2008 Io Scrapy Gis Kubernetes Vagrant C++ Cli Mod Rewrite Database Design Drop Down Menu Antlr4 Html5 Canvas Dojo Symfony1 Asp.net Mvc 5 Linq To Sql Hash Jhipster Coldfusion Asp.net Web Api Stripe Payments Interface C# Amazon Cloudformation Time Terraform Xamarin.android Phpstorm Seo Google Apps Script Swing Responsive Design Sharepoint 2007 Xsd Autohotkey Sharepoint 2010 Latex Drupal Centos Collections

Copyright © 2024. All Rights Reserved by - Fatal编程技术网