Cloud 在云基础设施上构建时,为什么需要编写容错应用程序?

Cloud 在云基础设施上构建时,为什么需要编写容错应用程序?,cloud,fault-tolerance,Cloud,Fault Tolerance,我今天收到了一个采访问题“在云基础设施上构建时,为什么需要编写容错应用程序?” 我回答:它们很难调试,也很难修复,所以它们最好经过很好的测试,并且非常健壮。数据库中的数据可以在后续读取之间进行更改(并没有状态服务器),在这两次读取之间可能会出现很多故障,所以必须“准备”应对意外情况 我答对了吗?有没有遗漏什么 我认为这不是一个特别好的问题 他们可能会想到一些基于云的系统,通常是大规模的,它们有许多独立的组件,通常运行在不同的硬件上,您不会希望一些任务运行在1000台服务器上,例如,仅仅因为其中一

我今天收到了一个采访问题“在云基础设施上构建时,为什么需要编写容错应用程序?”
我回答:它们很难调试,也很难修复,所以它们最好经过很好的测试,并且非常健壮。数据库中的数据可以在后续读取之间进行更改(并没有状态服务器),在这两次读取之间可能会出现很多故障,所以必须“准备”应对意外情况


我答对了吗?有没有遗漏什么

我认为这不是一个特别好的问题

他们可能会想到一些基于云的系统,通常是大规模的,它们有许多独立的组件,通常运行在不同的硬件上,您不会希望一些任务运行在1000台服务器上,例如,仅仅因为其中一台服务器上的故障或硬件故障而停止

服务器数量越多,在任何给定的“运行”过程中,其中一台服务器发生故障的统计概率就越大,因此他们可能试图解决这个问题,并让您说整个系统应该“容忍”一台或多台服务器的故障

然而,也有许多小型非关键网站/博客/web应用程序也运行在云基础设施上,它们可能不需要或不需要关注容错

类似地,很多非云应用程序都应该将容错作为设计考虑的一个关键部分。例如起搏器或汽车安全气囊控制器,即使它们不是在云中运行(我希望…)