В Kafka consumer-а платежей появились периодические timeout-ы. Какие первые гипотезы проверите?
Что хотят услышать интервьюеры:
Суть: Для Kafka consumer-а платежей нужно рассматривать не только код, но и нагрузку, зависимости, таймауты, данные и эксплуатацию.
Ответ:
Что проверить:
- offset commit, idempotency, retry, DLQ, consumer lag
- логи с request-id/trace-id
- метрики latency/error rate/saturation
- профили pprof или планы SQL, если проблема в производительности
Пример:
ctx, cancel := context.WithTimeout(ctx, 2*time.Second); defer cancel() Типичная ошибка: сразу менять код или увеличивать ресурсы без локализации bottleneck и без проверки гипотез.
Как отвечать на собеседовании: идите по цепочке: симптом → метрики → гипотезы → проверка → исправление → регрессия/мониторинг.