Установка и min_pending_latency
иmax_pending_latency
посылает смешанные сообщения в autoscaler.
В целом, вы можете настроить autoscaler к либо содержать ваши затраты (установить низкое значение для max_idle_instances
и/или высокого для min_pending_latency
), или улучшить свою масштабируемость - то есть, держать задержки низкий для всплесков трафика (задайте высокое значение для min_idle_instances
и/или низкое для max_pending_latency
).
Не Смешайте два вида ухищрений - такие «смешанные сообщения», по моему опыту, никогда не приводят к хорошим эффектам ни при каких издержках, ни при латентности во время всплеска.
И да, я я работать, чтобы иметь эту основную часть информации стала частью официальной документации Google Cloud Platform - он просто занимает больше времени, чем я надеялся, что, почему, тем временем, я вывешиваю этот ответ.
Более продвинутая альтернатива, если вы очень уверены в своих шаблонах трафика с течением времени, возможностях всплесков и т. Д., Заключается в переключении с автоматических масштабированных модулей на базовые или даже с ручной масштабированием, написав свой собственный код для запуска и завершения экземпляров через Modules API.
В любом случае, я должен признать, что это никогда не работало оптимально для меня, для модулей, предназначенных для обслуживания пользовательского трафика (в отличие от задач-очередей или основанных на базе cron «бэкэнда») - скачки и временные диаграммы пользователей никогда не были столь же предсказуемыми, как анализируя прошлые записи, мучительно предлагаемые. Итак, в конце концов, я всегда возвращался (для обслуживания пользовательского трафика) к хорошему старому автомасштабированию, возможно, со скромными настройками либо, чтобы сократить расходы, или, чтобы улучшить масштабируемость, как я рекомендую выше.
Итак, как вы думаете, это хорошая конфигурация, которая может содержать затраты? 'automatic_scaling: min_pending_latency: 500 мс max_idle_instances: 2' –
@ JavierMarín, да, я считаю, что это, скорее всего, сократить затраты по сравнению с по умолчанию' auto' масштабирования (в зависимости от формы и частоты ваших скачков напряжения в использовании). –