Google app engine googleappengine中的实例延迟

Google app engine googleappengine中的实例延迟,google-app-engine,latency,Google App Engine,Latency,我正在运行一个免费应用程序,并使用GAE的Python运行时使用1个最大空闲实例 根据, 应用程序的延迟对用户数量的影响最大 为您的流量服务所需的实例。如果您需要服务请求 很快,单个实例可以处理大量请求 这似乎表明,最好将“应用程序设置”中的滑块调整到最小延迟 但据报道, 高延迟似乎有助于防止负载峰值使新实例加速 因此,延迟基本上是对请求峰值(高延迟)的响应能力与给定时间段内处理的请求数量(低延迟)之间的折衷吗?“等待延迟”是指在应用程序引擎决定启动另一个实例之前,请求可以在队列中停留多长时间。

我正在运行一个免费应用程序,并使用GAE的Python运行时使用1个最大空闲实例

根据,

应用程序的延迟对用户数量的影响最大 为您的流量服务所需的实例。如果您需要服务请求 很快,单个实例可以处理大量请求

这似乎表明,最好将“应用程序设置”中的滑块调整到最小延迟

但据报道,

高延迟似乎有助于防止负载峰值使新实例加速

因此,延迟基本上是对请求峰值(高延迟)的响应能力与给定时间段内处理的请求数量(低延迟)之间的折衷吗?

“等待延迟”是指在应用程序引擎决定启动另一个实例之前,请求可以在队列中停留多长时间。如果请求到达时,您的所有应用程序实例都很忙,则该请求将在队列中等待下一个可用实例处理。如果超过最小值,应用程序引擎可能会决定启动一个新实例来处理该请求。(您还可以调整最大等待时间设置。)

最小挂起延迟是可配置的,因为启动新实例需要时间和金钱。更大的最小挂起延迟意味着appengine在启动新实例之前会将挂起的请求保留更长的时间(并让它们等待),这有利于实例成本与处理更多流量的能力。较小的最小挂起延迟意味着随着流量的增加,应用引擎将更频繁地启动新实例


术语“延迟”只是指应用程序响应请求所需的时间。应用程序响应请求的速度越快,单个实例可以处理的请求越多,请求队列通常越短。较低的延迟总是好的,但这取决于应用程序是否能够快速完成它需要完成的任务。

延迟是指代码响应请求的延迟。调整滑块与此无关。如果您遇到高延迟,但代码速度很快,则意味着AppEngine需要启动应用程序的新实例。这可能是因为你刚刚上传了它,或者没有人使用它很长时间,空闲的实例被关闭了,或者其他正在运行的实例被卡住了。Hi Dan,虽然你的答案是4年前的,但仍然相关。
之间的区别是什么?这两个值都指当自动定标器在挂起队列中发现未完成的请求时决定启动新实例的时间。最小值表示“在请求至少等待这么长时间之前,不要尝试启动新实例”。最大值表示“如果请求等待这么长时间,请启动新实例”。这两个值之间有一些回旋余地,或者最大值为“自动”(默认值),允许scaler猜测何时需要哪些资源。参考: