Опубликовали перевод 7 главы книги «Основы инженерии данных»
Глава посвящена одному из ключевых этапов жизненного цикла данных - поглощению. Авторы подробно описывают процесс поглощения данных из различных источников. Кроме того, рассматриваются ключевые инженерные аспекты этого этапа, основные схемы пакетной и потоковой интеграции, технологии, с которыми вы столкнётесь, коллеги, с которыми будете взаимодействовать при разработке вашего конвейера поглощения данных, и как фоновые процессы влияют на этот этап.