Я недавно познакомился с метриками процентиля для измерения различных аспектов эффективности вашего приложения (например, например, для латентности p50, p90 и p99 и т. Д.) Я не уверен, почему используются p50s, подобные этому показателей нечеткое и не предоставляет большую часть информации, если вы хотите измерить эффективность своего приложения. Я думаю, что это может быть широкий вопрос, но какие процентили отражают большую часть эффективности вашего приложения?Какие показатели процентилей отражают производительность вашего приложения?
ответ
Чтобы ответить на ваш вопрос, я расскажу немного о среднем/среднем значении. Пример, у меня есть несколько образцов (время отклика веб-запрос) 1,2,1,3,2,2,1,3,2,40
Если я беру среднее/среднее, то есть: 5,7
Здесь вы скажете, что мое среднее время отклика 5,7, которое не представляет собой реальный случай. здесь вы можете увидеть, что большинство образцов ниже 3, но из-за одного outlier ваше среднее значение изменилось с 1.9 до 5.7. Проблема со средним/средним значением, иногда это не фактические результаты
Процентные показатели позволяют нам предоставить актуальное изображение. Здесь, если вы возьмете 90 процентов, значение равно 3. Поэтому вы можете сказать, что 90% моих ответов ниже 3. , который представляет реальный случай или близко к вашему фактическому значению.
Надеюсь, вы понимаете, почему используются процентили.
На практике в измерениях производительности обычно используются 90-е, 95-е (в основном) и 99-й процентили, чтобы определить фактические значения, удалив выбросы.
Там нет однозначного ответа на который процентиль для использования в этом случае, потому что зависит от приложения, моделирования данных, доступных образцов и т.д.
На практике 90-х и 95-й процентили используются в большинстве случаев, чтобы увидеть потому что это дает вам уровень доверия 90% или 95%, которого достаточно в большинстве случаев.
Я получаю идею за процентили и то, как средние значения - наихудшая вещь для использования, но это не вопрос о том, что означает процентиль, а скорее о том, какие типы процентилей использовать? Я видел метрики 95-го, 99-го, а иногда и 99,9-го процентиля, но я не могу найти, в каких случаях использовать какой. Кажется, что что-нибудь ниже 99-го игнорирует хорошее количество информации –
Нет правила большого пальца или ответа на вопрос «Какой процентиль будет использоваться в этом случае», потому что это зависит от множества вещей, таких как ваша модель данных, доступных образцов, ожидаемой уверенности интервал. Но, как я уже сказал, в большинстве случаев достаточно 90 или 95-го. –