我正试图用Glassfish 3.1.2.2创建一个集群,我创建了集群,然后创建了实例并启动了它们,一切正常,然后我启用了AJP端口,使用mod_jk从Apache创建loadbalancer,步骤如下(从Glassfish方面):
我从tomcat获得了jar文件(commons-logging-1.1.jar、commons-modeler-2.0.1.jar、tomcat ajp.jar),并将它们放在Glassfish的lib文件夹中(不是域)
然后,我为每个实例添加了系统属性(带有特
我是Vert.x的新手,对此有很多问题。有一个关于它的小文档和教程
我想通过Vert.x构建一个在多服务器上运行的web服务。如果我这样做了,我需要配置任何东西吗,比如DNS。。。?任何人都有关于Vert.x的文档,请分享这是一个非常广泛和模糊的问题,并不真正适合堆栈交换。但是,在网站上有许多语言的网站教程
关于DNS等,我需要更多地了解您的设置,如果您只是想在本地开发一些东西,请尝试上面链接上的教程之一
首先,我为这篇冗长的文章道歉。我正在使用Hazelcast 3.4.4并测试一个由2个webapp节点组成的集群。。。一个运行在我的本地windows机器上(10.10.222.239),另一个运行在linux虚拟机的另一个机器上(10.10.222.145)。hazelcast配置设置如下:
<hz:hazelcast id="instance">
<hz:config>
<hz:spring-aware />
<
我有一个配置了DRBD资源的高可用性集群
当资源出现故障时,是否有方法接收通知,例如发送电子邮件
我正在使用Web UI(GUI)高可用性起搏器界面,但我没有找到一种方法来做到这一点 有几种方法可以实现这一点
最好的方法可能是在Pacemaker中配置通知。Pacemaker支持内置的SNMP、SMTP和自定义通知代理。起搏器文档是开始研究的好地方:
但是,例如,如果您想编写自己的通知代理,可以在集群可以访问的地方创建一个脚本,如/usr/local/bin/notification scrip
我是JBoss的新手。基本上,我需要在windows上设置JBoss群集环境。也就是说,JBossA位于机器A上,JBossB位于机器B上。因此,当JBossA失败时,它会将客户端重定向到JBossB
我已经下载了enterprise-installer-5.0.1.jar。之后,我完全不知道如何着手建立集群。我应该采取哪些步骤??或者我还需要下载哪些其他文件
任何导游都将不胜感激。谢谢
凯文找到了答案。。。基本上我只需要-c all就可以得到集群什么类型的客户端?HTTP?JMS?嗯。。。对客
我在AmazonEC2中尝试了3个节点的弹性搜索集群配置。但是在调用$type->addDocument($doc)之后,我得到了unavailableshardexception
以下是客户机中3个节点中每个节点的配置。请帮忙
Node1
=====
cluster.name: MyCluster
node.name: node1
node.master: true
node.data: true
# index.number_of_shards: 5 //Not confugured thi
我使用haproxy作为mariadb galera集群的banlancer,
它可以正常连接并执行一些操作,但几秒钟后我想再次执行一些搜索,但在查询错误期间失去了连接。请参见下图中的错误
这是我的haproxy.cfg
defaults
log global
mode tcp
option tcplog
option
我有一个起搏器/Corosync群集与SAN一起运行。我尝试在这个环境中设置LXD,但我无法这样做。
我找不到一种方法将LXD容器环境放在SAN上的一个目录中,所有节点都可以访问该目录。
我尝试的第二种方法是使用LXD集群特性。但我无法在SAN上的简单gfs文件系统目录上配置远程存储。
有人知道如何将LXD置于共享环境中吗?这与将其放在nfs文件系统上的方式类似。对不起,是哪个SAN?我是说它是Brocade SAN,或者你是说Cisco Iscsi SAN?
如果是锦山。是的,你可以,但这是一
我想运行一个需要大量内存(>100GB RAM)的作业。但是,我可以访问的每个节点只有高达80GB的可用RAM。有没有一种方法可以利用多个节点的存在,并结合它们的内存来运行这种作业
我正在学习Java下的MPI,到目前为止,我完全可以用MPJ编写控制台应用程序。但是,现在我想混合使用Java Swing库和MPI。可能吗?我喜欢创建一个小窗口,带有按钮和文本框。在文本框中输入一个值,当您单击jbutton时,将根据文本框中的值启动一定数量的MPI进程。有可能写这样一个应用程序,请给我一些想法?谢谢。我不知道您是如何启动MPJ程序的,但您需要考虑MPI程序的两个常见操作模式
MPI程序通常是在某些初始化过程(如mpiexec)的控制下启动的,这些初始化过程会启动许多进程以执行
我正在一个集群marklogic环境中工作,我们有10个节点。所有节点都是共享的E&D节点。
我们面临的问题是:
当使用marklogic写入页面时,集群中的所有节点需要一段时间(最多3秒)才能更新&its在此期间,如果我执行读取操作以获取以前写入的页面,则找不到该页面
是否有人遇到过此延迟问题?并希望消除它,然后请让我知道
谢谢新文档只有在数据库事务提交后才会出现是正常的。但提交需要3秒的时间是不正常的
MarkLogic Server的哪个版本
哪个操作系统和版本
你能描述一下硬件配置吗
我使用Hazelcast(3.2版)在一个应用程序的两个运行实例(两个不同的JVM,节点通过tcp连接)之间建立一个分布式队列。我的每个实例都是一个节点,每个实例都有异步客户端
出于某种原因,我必须更改distributedQueue和备份过程的最大大小(从异步更改为同步)。
我需要每次至少运行一个实例,我将更改每个实例的hazelcast配置,并逐个重新启动实例(tomcat)
我的问题是:配置差异会成为问题吗?
我的分布式队列在我的每个实例(节点)的hazelcast配置文件中配置
其他问题
我有这样一个.txt表:
column1: Source Node
column2: Target Node
column3: Edge attribute
column4: Source Node attribute
example: 0.01,0.8,0.1,0.9
第4列是如下所示的浮点数列表:
column1: Source Node
column2: Target Node
column3: Edge attribute
column4: Source Node attribut
我们正在开发snake管道,需要在nas文件系统和集群节点之间传输数据。
我们的集群有一个架构,每个节点中都有一个/scratch目录。在启动规则之前,我们需要将数据从nas复制到node/scratch。
下面是我们使用的典型slurm脚本示例:
#!/bin/bash
############ SLURM CONFIGURATION ###################
#SBATCH --partition=supermem
#SBATCH --job-name=Sp
我有一个关于基于聚类的熵计算的问题。
每个簇由蛋白质轨迹的kmeans计算。
问题是找到一个簇的熵S_i,因为总的
熵S由S=\sum S_i*(N(i)/N)求出,其中N(i)是
第i个簇中的帧数,N是总帧数
对于第i簇的熵:我能假设S_i=-k_B*[ln(p)]
(=ln(p)的期望值)?根据维基百科,这与ln(方差)成正比。
我假设每个集群都是高斯分布的。我能计算出任何原子的方差,把这些加起来,并将其插入公式中(因为高斯和是高斯的)
谢谢大家!
我在应用服务器上部署了一个标准的web应用程序。
该应用程序使用Struts 1、iBatis、JSP、servlet和一些非常基本的东西
现在,该应用程序将部署到Weblogic集群。是否有什么特别需要修改的地方,以便将应用程序部署到集群,例如,事务如何?
或者部署到集群对开发人员来说是不可见的?
寻找一般性的事情,当web应用程序部署到集群时,确实需要做的事情。我建议尽量减少会话数据。会话数据要么迫使用户“粘滞”(一旦用户使用某个特定服务器,他们就必须继续使用该服务器),要么集群软件必须将所
两者都被定义为一组协同工作的计算机,让最终用户感觉到它背后运行着一台计算机
那么这里有什么区别呢?汽车和跑车有什么区别?
集群是一个系统,通常由单个公司管理。集群通常具有非常低的延迟,并且由服务器硬件组成。分布式系统可以是任何东西。将JS放在客户端和PHP服务器代码一起组成一个系统已经被一些人称为分布式系统
一般来说,在使用分布式系统时,您经常会遇到长延迟和意外故障(如p2p系统中提到的)。在构建集群(或可以称为超级计算机的大型集群)时,您试图通过使用更健壮的硬件和更好的网络互连(InfiniB
我有几千个作业要在一个有16个节点的SLURM集群上运行。这些作业应仅在大小为7的可用节点子集上运行。一些任务是并行的,因此使用单个节点的所有CPU能力,而其他任务是单线程的。因此,多个作业应在单个节点上同时运行。所有任务都不应在多个节点上生成
目前,我提交的每个作业如下:
sbatch --nodelist=myCluster[10-16] myScript.sh
但是,此参数使slurm等待提交的作业终止,因此留下3个完全未使用的节点,并且根据多线程或单线程任务的不同,当前活动节点可能在C
在尝试使用-baseout参数时,我在HPC上运行Trimmomatic v.0.33时遇到了一些奇怪的行为
我的代码如下所示:
java -jar /path/to/trimmomatic-0.33.jar PE input_fastq_1.fq input_fastq_2.fq \
-baseout mybaseoutname ILLUMINACLIP:TruSeq2-PE.fa:2:30:10 LEADING:3 TRAILING:3 SLIDINGWINDOW:4:15 MINLEN:3
我想让hostname在四个不同的节点上运行一次。这就是我正在尝试的:
balter@exahead1:~/slurm_tutorial$ cat nodes.sub
#!/bin/bash
#SBATCH --job-name=nodes
#SBATCH --array=0-3
#SBATCH --nodes=4
#SBATCH --tasks-per-node=1
##SBATCH --ntasks=4
#SBATCH --output="nodes_%N_%A_%a_%j.out"
#S
我正在开发一个工具,用于监视集群上当前运行的作业(19个节点,40个核心)。有没有办法确定slurm队列中的每个作业正在使用哪个特定CPU?我使用“pidstat”、“mpstat”和“ps-eFj”获取数据,它们告诉我在特定内核上运行哪些进程,但无法将这些进程ID与Slurm使用的作业ID关联起来“控制显示作业”提供了大量信息,但没有具体的cpu分配。有没有办法做到这一点
以下是收集数据的代码:
#!/usr/bin/env python
import subprocess
import t
我想对具有混合特征(数字和分类)的数据集执行离群点检测。搜索之后,我读到了关于使用可用于异常检测的K-prototype聚类的内容。我不知道如何使用它来达到这样的目的?顺便说一句,数据集有标签。如果你们知道另一种异常值检测方法,我会很感激的
我知道标签编码技术可以将分类转换为数字。我认为这会产生误导,因为大多数功能都是名义上的(非序数)
我们在AWS的Windows服务器上有一个HPC环境。我们希望与多个用户共享计算能力。我不知道windows环境中有任何工作负载管理器或调度程序。我知道SLURM,但它与Windows不兼容
请提供帮助。HTCondor支持windows工作流管理
我正在集群上学习OpenMPI。这是我的第一个例子。我希望输出会显示来自不同节点的响应,但它们都来自同一个节点node062。我只是想知道为什么以及如何从不同的节点获取报告,以显示MPI实际上正在将进程分发到不同的节点?谢谢和问候
例1.c
/* test of MPI */
#include "mpi.h"
#include <stdio.h>
#include <string.h>
int main(int argc, char **argv)
我有一个网站www.mysite.com运行在负载平衡器后面。负载平衡器群集中有两台服务器。每个都运行Varnish 3.0和Apache/PHP(我知道Varnish可以为我实现负载平衡,但我们更喜欢不同的LB技术)
时不时我需要清除一两个URL
在我的VCL中,我有127.0.0.1作为清洗的可信URL。和标准清除配置:
vcl_recv:
....
if (req.request == "PURGE") {
# Allow requests from trust
集群设置完成后,我在终端中切换到ejabberd/bin目录。然后我输入这个命令
erl -sname ejabberd@test -mnesia extra_db_nodes "['ejabberd@testone']" -s mnesia
执行此命令后,我在终端中出现此错误
{error_logger,{{2013,10,15},{17,3,14},“Cookie文件/root/.erlang.Cookie只能由所有者访问”,[]}
从:
在启动时,一个节点有一个随机原子作为它的魔法co
我的问题是:如果我有一个需要一些lib的可执行文件,那么我必须将这些lib安装到网格的所有节点上,还是有办法将libs安装到一个节点上,然后共享给所有其他节点
提前感谢。如果所有节点运行相同的系统(相同的体系结构、版本等),您应该能够将LIB存储在共享驱动器上。请注意,频繁地从共享位置读取lib可能会影响可执行文件的速度。Hi choroba。谢谢你的回答。我如何知道是否存在共享驱动器以及如何定位它?@Nesbit:询问您的群集管理员?或者做一些实验:在集群上运行mount,检查结果……这与po
我正在使用elasticsearch 2.4.1
我有一个ES节点集群和另一个存储数据的独立节点
我想将独立节点添加到ES群集。执行此操作时,会丢失独立节点中存储的所有数据
如何将独立节点的数据添加到集群
谢谢在节点加入群集之前,独立节点和ES群集的群集名称是否相同?否,独立节点没有群集名称。无论如何,我用elasticdump解决了这个问题。谢谢
我为一个将数据写入本地磁盘的应用程序设置了一个测试2节点HA集群。已为此设置DRBD,以便将数据同步到第二个节点上。我的应用程序依赖于主机名来启动/停止和执行任何任务。为了使其高度可用,我设置了集群IP,并将节点的实际名称临时重命名为虚拟IP的名称
手动将DRBD资源升级到主节点,并随时将其装载到设置了虚拟IP的任何节点上,所有这些都可以正常工作
只要我尝试在pacemaker中添加DRBD资源,然后使用临时名称(使用hostname命令更改主机名,例如:-nodeA:~#hostname te
我正在使用设置VPS群集
这已经非常有效了。我定义了一个名为instance\u size的变量,默认设置为1gb。我正在使用我的资源定义中的计数参数设置几个具有完全相同配置的VP:
variable "swarm_instance_size" {
default = "1gb"
}
resource "digitalocean_droplet" "server" {
image = "123456"
size = "${var.instance_size}"
我有一个Aerospike 3.11.1.1集群,有6个节点。当我尝试添加新节点时,有时在集群迁移数据时,某些对象会暂时丢失。迁移完成后,丢失的数据将返回。这是一个错误还是我做错了什么?如何避免
注意,在进行迁移时,主对象计数低于迁移完成后的实际最终对象计数
完成迁移之前的主副本和副本计数:
完成迁移后的主副本和副本计数:
我的aerospike.conf:
service {
user root
group root
paxos-single-replica-limit
我有两个使用spread toolkit的进程,我想在同一台机器上运行它们,但它们不应该在spread中看到彼此
我能想到的唯一简单的解决方案是在同一台机器上运行以在不同端口和配置上分布实例
有没有办法在排列配置中而不是在上面的解决方案中将它们分开?排列特定的答案
根据报告:
配置和设置问题
What ports can you run it on?
Any ports you want. Just change the ports in the configuration file spre
我们需要在我们的一个系统上进行高可用性集群。我从RedHat找到了一些工具,比如HA Lvm,但netbsd不支持它。我们需要这样一种场景,即应用程序应在主动/被动故障切换配置中以最佳方式运行,在这种配置中,任何时候只有一个访问共享存储的节点处于活动状态。netbsd上还有其他工具,如corosync,但它们可以创建存储的复制。我们希望两个系统共享存储。如果一个下降,那么另一个上升,在同一个存储上提供不间断的服务 你的问题不是很清楚,但你应该看看ucarp。它是NetBSD和OpenBSD使用的
在具有两台主机和一个服务器组的AWS域环境中,“主服务器组”主机1只有一台称为服务器1,主机2有一台称为服务器2。domain.xml文件使用标准infinispan配置和TCping而不是MPING(未启用多播)
当两台主机同时启动时,我有一个例外:
主持人1
2016-06-07 10:43:39,455 ERROR [org.infinispan.remoting.InboundInvocationHandlerImpl] (remote-thread-0) ISPN000260: Exc
我已经建立了一个简单的过程组。它生成一个包含一些随机内容的流文件,并将其发送到Nifi远程进程组。
此远程进程组配置为将流文件发送到localhost,或者在本例中发送到我自己的主机名(我也尝试了localhost)
在此之后,流文件应出现在“From MiNiFi”输入端口,并发送到LogAttribute。没什么特别的
我配置为使用RAW,但使用HTTP它都不起作用
我正在使用apache/nifi docker映像,并且没有更改nifi.properties和authorizers.xm
我们有一台运行Windows server 2008的服务器,安装了运行5台虚拟机的Hyper-V。我已经购买了第二台DELL R805服务器,以便我们可以为当前正在生产的R805创建故障转移群集。现在,我们的R805通过iSCSI连接到MD3000i iSCSI SAN。在我们尝试在生产环境中推出第二台服务器和集群之前,我希望在推出之前能够在实验室中测试和“使用”集群功能。问题是,我不想为了测试而在另一台iSCSI SAN服务器上花费几千美元。我的实验室中已经有两台服务器安装了Windows
有人知道哪种资源管理器适合PVM吗?或者我不应该使用PVM,而应该依赖MPI(或者它的任何版本,比如MPICH-2[还有其他更好的版本吗?])。使用PVM的主要原因是因为在我之前开始这个项目的人假设使用PVM。然而,现在这个项目是我的(他没有做任何重要的工作,依赖于PVM),这可以很容易地改变,最好是易于安装的东西,因为安装和设置PVM是一个大麻烦
我倾向于SunGridEngine,因为我有专用硬件,在阅读了另一篇关于哪些硬件更适合专用硬件的帖子后,SGE似乎是赢家。但是,我不确定它使用PVM
不管出于什么原因,一堆指数都没有分配。我正在寻找一种在不丢失任何数据的情况下将它们分配到集群节点的方法
我尝试使用以下API调用,但不幸的是,它导致数据丢失(由于允许\u primary):
我还在elasticsearch.log中不断获得以下条目:
[2015-03-16 11:51:12,181][DEBUG][action.search.type ] [cluster node] All shards failed for phase: [query_fetch]
[2015
我有一个mesos集群,有一个主集群和6个代理。我已为用户启用身份验证,并在启动mesos master时通过其角色传递用户凭据。现在,我想动态地向主机添加新用户。如何在不停止mesos master的情况下完成此操作?您可以开发自己的身份验证模块
Authenticate和Authenticator模块允许第三方快速开发和插入新的身份验证方法。此类模块的一个示例是支持PAM(LDAP、MySQL、NIS、UNIX)支持的身份验证。-
您可以看到如何执行此操作的示例。这段代码很旧,但它显示了基本
ES配置:
节点1:
cluster.name: mycluster
node.name: "node1"
node.master: true
node.data: true
discovery.zen.ping.unicast.hosts: ["192.168.100.103"] # IP of node2
节点2:
cluster.name: mycluster
node.name: "node2"
node.master: true
node.data: true
discovery.
我正在寻找一个分布式消息队列,它将支持数百万个队列,每个队列每秒处理数十条消息
消息将很小(几十个字节),我不希望队列变得很长——每个队列最多有几十条消息,但是当系统运行时,队列应该保持相当空
我不确定集群中需要多少节点——可能取决于具体的解决方案,但如果我不得不猜测的话,我会说10个节点。我更希望队列对集群中的单个节点故障具有相对的弹性,但是这里和那里丢失的一些消息不会让我失去睡眠
是否存在这样的消息队列?似乎该领域的大部分内容都经过了优化,能够以高吞吐量处理数百个队列。但是SQS是建立在什么
在关于群集管理的几个演示(例如,,)中,调度器的目标之一是通过将单个作业的任务分布在计算节点上以减少一起发生故障的可能性,从而减少协调故障
为什么单个作业中的相关任务失败是不可取的?如果我理解正确,所有的任务都需要在工作完成之前完成。因此,乍一看,如果任务失败仅限于少数作业,那么只有这些作业会因为重新提交失败的任务而经历延迟,这会更好
如果一个作业中的所有任务都只是复制相同的工作,我会理解,但每个作业有数百个任务是不可能的(可能有3-4个相同的任务用于容错目的,我确实理解为什么减少这些任务组的相
我想用3台虚拟机建立一个arangodb集群
在我执行的第一台机器中,$arangodb得到以下输出
ubuntu@arangodb-1:/etc/arangodb3$ arangodb
2018/04/19 09:15:46 Starting arangodb version 0.10.4, build 553aab6
2018/04/19 09:15:46 Serving as master with ID '5f388575' on :8528...
2018/04/19 09:15
我正在设计一个简单的PoC ActiveMQ Artemis集群配置
到目前为止,让各个代理都能正常工作已经相当不错了,但我现在想让其中一个代理从生产者那里接收消息(区域性的),并让消费者将这些消息连接到另一个节点(全局性的)
不幸的是,当我启动我的区域代理时,我最终在其日志中看到以下内容:
2020-06-12 14:06:59,005 WARN [org.apache.activemq.artemis.core.server] AMQ222186: unable to authorise
我的理解是:本质上,A和p是一回事。因为从整个多节点集群的角度来看,AP始终是正相关的:我们基本上无法做出诸如“牺牲A获得P”或“牺牲P获得A”之类的设计选择
例如:您能否设计一个不允许网络分区的高可用性多节点群集(即:一旦出现网络分区,它将不可用)
这里不考虑单节点系统,因为CAP是分布式集群的法则。因此,CAP理论只能解释为:当多节点集群具有网络分区(p)时,,并且严重到集群中没有任何分区包含大多数节点。您现在可以选择保持一致性(C)或保持可用性(A)。您在这里想表达什么?A和P是如何变成同
我在WINDOWS7上使用VirtualBox作为两个DEBIAN7.7来宾的主机,deb1和deb2。每个客人都可以与另一位进行交流。使用一个访客浏览器,我可以看到在另一个访客上运行的Wildfly istance欢迎页面。我在独立ha模式下运行每个istance,网络接口已启用mutlicast,我可以在名为srv1的Wildfly节点上看到这两个istance构建了一个集群:
...
...ISPN000094: Received new cluster view: [srv2/web|3
我读过关于RavenDB集群()的失败场景的文章,这些文章非常有用。但是,该解决方案仅适用于SequentialShardAccessStrategy,或者至少我无法使用ParallelShardAccessStrategy使其工作:o) 有没有并行ShardAccessStrategy的方法?shardStrategy=新的shardStrategy(shardStores);shardStrategy.ShardAccessStrategy=新的顺序ShardAccessStrategy()
ansys存在一些问题。当我启动它时,它会抱怨一些分区。我们正在使用slurm。它是否抱怨运行作业的slurm分区?但RDMA听起来更像是一个硬盘分区。我有点困惑问题的原因是什么。访问slurm中的文件系统或不同队列(分区)?以及如何修复它。有没有人以前遇到过这个错误,可能知道解决方案
它运行在一个slurm集群上,该集群具有一个NFS/home、一个NFS/opt(ansys安装)和一个BeeGFS/work dir(用于模型等)
cfx5remote:Rank 0:25:MPI_Init_线
我想在一台机器上,在不同的unix用户下运行两个ApacheFlink实例
我已经为jobmanager.rpc.port和rest.port设置了不同的端口,但是当尝试通过start cluster.sh启动时,它会抱怨实际使用的地址:
2019-04-04 13:48:08,218 INFO akka.remote.Remoting - Starting remoting
2019-04-04 13:48:0
我正在尝试创建一个弹性搜索集群,但这两台计算机并没有将彼此视为集群,我尝试了很多,但都没有
machine-1(x.x.45.131)elasticsearch.yml
cluster.name: my-application
node.name: node-1
node.master: true
node.data: true
node.ingest: true
network.host: ["x.x.45.131"]
discovery.zen.ping.unic
上一页 1 2 3 4 5 6 7 8 9 ...
下一页 最后一页 共 15 页