Skills
Pipelines batch e streaming
ETL/ELT com Airflow e dbt
Governança e qualidade de dados (LGPD)
Sobre a Vaga
Você vai construir, operar e evoluir a infraestrutura de dados da companhia, garantindo disponibilidade 24/7 e qualidade para suportar análises, previsões e operações do negócio. A atuação é orientada à cultura AI-Native, usando IA para acelerar entregas técnicas e apoiar as áreas com dados confiáveis.
Responsabilidades
- Desenhar e manter pipelines de ingestão batch e streaming a partir de fontes como NGX, CRM Smartico, provedores de jogos, gateways de pagamento e canais de atendimento
- Construir e evoluir Data Warehouse e Data Lake com arquitetura moderna em camadas (bronze, silver e gold) e governança ponta a ponta
- Automatizar rotinas de ETL/ELT com ferramentas como Airflow, dbt, Fivetran ou equivalentes, respeitando SLAs acordados
- Atender demandas das áreas de Lifecycle & CRM, Performance MKT, Ops, Tecnologia & Produto, Financeiro, Jurídico, Gente & Gestão, estruturando dados no formato necessário
- Garantir integridade, segurança e compliance (LGPD), incluindo auditoria, controle de acesso por papel e mascaramento de dados sensíveis
- Monitorar performance de queries, custos de processamento e confiabilidade das pipelines, atuando continuamente na otimização de infraestrutura em AWS/GCP/Azure
- Colaborar com o time em modelagem dimensional, criação de data marts e camadas semânticas para consumo analítico e autoatendimento
- Apoiar o Head de Dados/AI na disponibilização de datasets e componentes para feature engineering, feature stores e modelos preditivos
- Desenvolver e manter APIs internas de dados para Produto, CRM e Marketing, com baixa latência e escalabilidade
- Documentar arquitetura, catálogo de dados, lineage e dicionários para aumentar discoverability e autonomia das áreas
- Implementar observabilidade com logs, métricas e alertas, além de dashboards para monitoramento proativo
- Participar do mapeamento de dados e processos junto ao Head de Dados/AI e ao PO/Scrum Master, traduzindo necessidades em backlog técnico
- Atuar como referência técnica, mentorando analistas e revisando código de pipelines críticos
- Aplicar IA no dia a dia para geração de código, revisão de queries, documentação, troubleshooting e detecção de anomalias
Requisitos
- Experiência com engenharia de dados, incluindo ingestão batch e streaming e construção/evolução de Data Lake e Data Warehouse
- Conhecimento em ETL/ELT e orquestração (ex.: Airflow), além de ferramentas como dbt e/ou Fivetran
- Vivência com governança de dados, qualidade, segurança e práticas de compliance (LGPD)
- Experiência com monitoramento e otimização de performance de pipelines e custos em cloud (AWS, GCP ou Azure)
- Capacidade de modelagem dimensional e criação de camadas semânticas/data marts para consumo analítico
- Habilidade para desenvolver APIs internas de dados e manter documentação (catálogo, lineage e dicionários)
Beneficios
- Ambiente orientado à cultura AI-Native, com uso prático de IA no fluxo de trabalho
- Atuação em projetos críticos para decisão e automação das áreas do negócio
- Oportunidade de liderar padrões técnicos e fortalecer a qualidade das entregas de dados