Warning: file_get_contents(/data/phpspider/zhask/data//catemap/8/.htaccess/5.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Amazon s3 AWS中带有s3的Accumulo群集不太稳定_Amazon S3_Apache Zookeeper_Accumulo - Fatal编程技术网

Amazon s3 AWS中带有s3的Accumulo群集不太稳定

Amazon s3 AWS中带有s3的Accumulo群集不太稳定,amazon-s3,apache-zookeeper,accumulo,Amazon S3,Apache Zookeeper,Accumulo,我们在AWS上使用s3而不是hdfs运行accumulo群集,有时我们无法再登录shell。我们尝试了不同的集群设置,但结果相同,有时会出现故障,我们无法再使用它。我想知道使用s3是否会导致一些问题 这是导致警告的日志:没有平板电脑 服务器:检查zookeeper和accumulo是否正在运行 无论是在日志上还是在互联网上,我们都看不到非常有用的信息 有什么想法吗 2016-04-13 14:57:56587[客户端客户端配置]警告:未找到 默认路径中的client.conf。使用默认客户端配置

我们在AWS上使用s3而不是hdfs运行accumulo群集,有时我们无法再登录shell。我们尝试了不同的集群设置,但结果相同,有时会出现故障,我们无法再使用它。我想知道使用s3是否会导致一些问题

这是导致警告的日志:没有平板电脑 服务器:检查zookeeper和accumulo是否正在运行

无论是在日志上还是在互联网上,我们都看不到非常有用的信息

有什么想法吗

2016-04-13 14:57:56587[客户端客户端配置]警告:未找到 默认路径中的client.conf。使用默认客户端配置 价值观2016-04-13 14:57:56591[客户端配置]警告: 在默认路径中未找到client.conf。使用默认客户端 配置值。2016-04-13 14:57:58421[fs.EmrFileSystem]信息 :一致性禁用,使用 com.amazon.ws.emr.hadoop.fs.s3n.S3NativeFileSystem作为文件系统 实施2016-04-13 14:57:59018[amazonaws.latency]信息: ServiceName=[Amazon S3],StatusCode=[200], ServiceEndpoint=[test accumulo.s3.amazonaws.com], AWSRequestID=[null],HttpClientPoolPendingCount=0, HttpClientPoolAvailableCount=0,RequestCount=1, HttpClientPoolLeasedCount=0,ResponseProcessingTime=[1.219], ClientExecuteTime=[347.47],HttpClientSendRequestTime=[2.211], HttpRequestTime=[247.724],RequestSigningTime=[38.773], HttpClientReceiveResponseTime=[32.567],2016-04-13 14:57:59023 [s3n.S3NativeFileSystem]信息:列表状态 s3://test accumulo/instance_id带递归假2016-04-13 14:57:59039[amazonaws.latency]信息:ServiceName=[amazons3], 状态代码=[200], ServiceEndpoint=[test accumulo.s3.amazonaws.com], AWSRequestID=[null],HttpClientPoolPendingCount=0, HttpClientPoolAvailableCount=1,RequestCount=1, HttpClientPoolLeasedCount=0,ResponseProcessingTime=[0.007], ClientExecuteTime=[14.182],HttpClientSendRequestTime=[1.802], HttpRequestTime=[12.222],RequestSigningTime=[0.915], HttpClientReceiveResponseTime=[8.026],2016-04-13 14:57:59165 [amazonaws.latency]信息:ServiceName=[AmazonS3],AWSErrorCode=[404 找不到],状态代码=[404], ServiceEndpoint=[test accumulo.s3-eu-west-1.amazonaws.com], 异常=[com.amazonaws.services.s3.model.amazons3异常:不 找到(服务:Amazon S3;状态代码:404;错误代码:404未找到 已找到;请求ID:5AF8579AA42CF9BE),S3扩展请求ID: hOWVSRu+ukai8IMHUvBbnQzGp3SvhXgHRiqzIzGrwJKhiJLRTM3+i4JiawJg7eFH1vk4mbPrKW8=], AWSRequestID=[5AF8579AA42CF9BE],HttpClientPoolPendingCount=0, HttpClientPoolAvailableCount=1,RequestCount=1,Exception=1, HttpClientPoolLeasedCount=0,ClientExecuteTime=[125.731], HttpClientSendRequestTime=[1.991],HttpRequestTime=[118.59], RequestSigningTime=[0.276],HttpClientReceiveResponseTime=[36.485], 2016-04-13 14:57:59309[amazonaws.latency]信息:ServiceName=[Amazon S3],状态代码=[200], ServiceEndpoint=[test accumulo.s3.amazonaws.com], AWSRequestID=[4EA22D07E9553B58],HttpClientPoolPendingCount=0, HttpClientPoolAvailableCount=2,RequestCount=1, HttpClientPoolLeasedCount=0,ResponseProcessingTime=[24.253], ClientExecuteTime=[141.373],HttpClientSendRequestTime=[0.727], HttpRequestTime=[110.592],RequestSigningTime=[0.358], HttpClientReceiveResponseTime=[104.977],2016-04-13 14:57:59313 [cse.CSEUtils]信息:无法从获取作业流Id extraInstanceData.json。设置jobflowId=未知。2016-04-13 14:57:59329[client.ClientConfiguration]警告:未找到client.conf 在默认路径中。使用默认的客户端配置值。 2016-04-13 14:57:59530[跟踪分配跟踪]信息:SpanReceiver 已成功加载org.apache.accumulo.tracer.ZooTraceClient。 2016-04-13 14:57:59577[impl.ServerClient]警告:没有平板电脑 服务器:检查zookeeper和accumulo是否正在运行


是的,我认为用S3运行Accumulo会导致问题。即使S3有一个文件系统实现,它的行为也不像普通的文件系统。区别的一些例子是,我们希望是原子的操作在S3中不是原子的,异常可能意味着与我们预期不同的事情,我们假设我们对文件及其元数据的看法是一致的,而不是S3提供的最终一致性


如果我们对Accumulo代码进行一些修改,这些问题可能会得到缓解,但据我所知,还没有人尝试在S3上运行Accumulo来找出问题,以及这些问题是否可以解决。

我们也在尝试将Accumulo与S3结合使用,感谢@billie为我们提供了这些关于“我们希望是原子的操作在S3中不是原子的”,你能给我们举个例子吗?也许像提交WAL这样的东西

关于一致性,是的,我们看到EMRFS提供了一致性,所以,使用这个“一致性视图”将解决一致性问题,还是

在一致性视图页面中,它说,一致性只有通过更新(覆盖放置)和删除操作才会成为问题,这是否可能在文件系统更新和删除操作期间阻止平板电脑上的请求更长一点(让它很快离线),以避免一致性问题?是否值得将此选项作为配置属性

顺便说一句……国家>

如果我们对Accumulo代码进行一些修改,问题可能会得到缓解

真的让我们担心…难道不可能解决问题吗?它们只能得到缓解吗


非常感谢。

这可能与与与zookeeper的错误通信有关。我可以在日志中看到这一点:警告:与zookeeper的通信出现(可能)暂时异常。我将尝试使用ip地址代替dns