Какой реальный баг может возникнуть из-за неправильного понимания latency percentiles?
Что хотят услышать интервьюеры:
Суть: p95/p99 важнее среднего для backend-сервисов под нагрузкой.
Ответ:
Пример:
histogram_quantile(0.99, ...) Практический акцент: Проверяйте не только happy path: добавьте негативные сценарии, timeout/cancel, граничные значения и регрессионный тест на типичную ошибку.
Типичная ошибка: ориентироваться только на average latency.
Как отвечать на собеседовании: Отвечайте через методику: метрики → профиль → гипотеза → изменение → повторное измерение.