Контроль качества данных для департамента продвинутой аналитики. Команда занимается задачами сопровождения data-продуктов.
Задачи:
· Сопровождение и анализ существующих процессов загрузки;
· Разбор технических контролей качества данных;
· Тестирование и установка доработок в продуктивный контур.
Мы ожидаем:
· Знание SQL, Python;
· Знание технологического стека: Apache Spark, Hadoop\S3\S3-like, Apache Airflow, Parquet\ORC. Знание Apache Iceberg будет плюсом;
· Понимание ETL;
· Навыки работы с Jira + Confluence или аналогичное, Git, CI/CD, XML, JSON;
· Навыки системного анализа, тестирования;
· Умение читать код, понимать, как данные из одного места транслируются в другое;
· Базовое знание работы с РСУБД, Kafka.
Мы предлагаем:
· Оформление официальное по ТК РФ/ИП/Самозанятый;
· Конкурентная «белая» заработная плата (обсуждается по итогам интервью);
· Формат работы: удаленно;
· Предоставление ДМС;
· Фитнес;
· Курсы повышения квалификации на ежегодной основе (по согласованию);
· Самые инновационные, амбициозные проекты и задачи;
· Корп.мероприятия (настолки, боулинг, квесты и т.д.), подарки на НГ детям сотрудников Компании и другие мероприятия для поддержания хорошего настроения;
· Возможность публиковать свои проф. статьи на Хабр в нашем блоге с сохранением своего авторства – как повышение своего уровня экспертности в проф.среде;
· Возможность профессионального и карьерного роста.