Web services 写一个';混沌猴';增强恢复力

Web services 写一个';混沌猴';增强恢复力,web-services,testing,infrastructure,Web Services,Testing,Infrastructure,我为这个问题的开放性道歉,但我认为这是一个非常有价值的讨论领域 在经历了最近的以及随之而来的大量恐怖故事之后,我对Netflix应用的混沌猴子“技术”印象深刻(Netflix是为数不多的几乎没有擦伤就幸存下来的公司之一) 对于那些不了解这一概念的人来说,它本质上是一个围绕您的基础设施运行的小机器人,在整个过程中造成混乱,作为一种持续测试恢复力的方法 除了这篇文章之外,我在其他任何地方都找不到这篇文章 虽然我很欣赏良好的测试驱动的发展是一个坚实的基础,我认为这将是一个伟大的补充,任何一个公司/组织

我为这个问题的开放性道歉,但我认为这是一个非常有价值的讨论领域

在经历了最近的以及随之而来的大量恐怖故事之后,我对Netflix应用的混沌猴子“技术”印象深刻(Netflix是为数不多的几乎没有擦伤就幸存下来的公司之一)

对于那些不了解这一概念的人来说,它本质上是一个围绕您的基础设施运行的小机器人,在整个过程中造成混乱,作为一种持续测试恢复力的方法

除了这篇文章之外,我在其他任何地方都找不到这篇文章

虽然我很欣赏良好的测试驱动的发展是一个坚实的基础,我认为这将是一个伟大的补充,任何一个公司/组织想要熬夜的兵工厂。
  • 以前有没有人接触过这个话题
  • 除了连接性和安全漏洞之外,您是否会看到这样一段代码击中其他特定区域
  • 对这种方法还有其他想法/感受吗

您可以进行一些测试来增强系统的压力。我喜欢使用apache bench加载测试写入数据库的页面。我会测试点击数和并发用户数

500个并发用户共发出5000个请求
$ab-n 5000-c 500 url

我知道我的Web服务器可以承受这一点,但我发现我记录信息的方式有问题。你可以指出你网站的不同方面

如果使用缓存,可以清除测试中间的缓存,以查看所有的事物都会很快恢复。

如果您可以在虚拟机中复制服务器,更改RAM的数量,卸载硬盘,耗尽磁盘空间,断开网络接口,等等


您可以尝试强制输入密码,并确保您的系统只允许n次登录尝试,然后再对该用户进行速率限制。

我们自己玩“混沌猴子”已经做得很好了。现在还不需要自动化。一种方法是无法为您的服务提供不间断电源。+1我认为这是一种事情ing—特别是对vm的抨击(谢天谢地,我们完全虚拟化了)