Когда Kafka consumer отстает по lag. Что делать? лучше не использовать или использовать осторожно?
Что хотят услышать интервьюеры:
Суть: проверить скорость обработки, partitions, commit strategy, ошибки, retry/DLQ, batch size, downstream bottleneck.
Ответ:
Пример:
monitor consumer lag by partition Практический акцент: Оцените trade-off: простота, производительность, тестируемость, связность пакетов и цена поддержки.
Типичная ошибка: просто добавить consumers больше числа partitions.
Как отвечать на собеседовании: Отвечайте структурно: симптомы → гипотезы → метрики/логи/трейсы → локализация → исправление → профилактика.