Skills
Python
SQL avançado
Apache Spark/Databricks
Sobre a Vaga
Estamos buscando um(a) Engenheiro(a) de Dados & IA Sênior para atuar em um projeto de automação de processos internos com IA generativa. Você fará parte de um pipeline multiagente em produção, com integrações entre diferentes sistemas e modelos de última geração.
Responsabilidades
- Projetar e implementar pipelines de dados batch e streaming para alimentar soluções de IA, analytics e dashboards
- Desenvolver e manter arquiteturas Data Lakehouse (Bronze, Silver e Gold) com tecnologias como Iceberg, Delta Lake ou Hudi
- Construir integrações com bancos relacionais, APIs, sistemas legados, mensageria e ambientes cloud
- Assegurar qualidade, governança, observabilidade e performance dos pipelines em produção
- Estruturar pipelines para IA Generativa, incluindo chunking, embeddings, indexação semântica e recuperação de contexto (RAG)
- Operar e otimizar ambientes de Vector Databases
- Contribuir com iniciativas de MLOps/DataOps, feature stores e preparação de datasets para treinamento e avaliação
- Aplicar práticas de segurança, compliance com LGPD, lineage e documentação técnica
- Atuar em squads multidisciplinares, apoiando entregas para clientes enterprise
- Realizar mentorias técnicas e apoiar a evolução da arquitetura e a disseminação de conhecimento no time
Requisitos
- Experiência sólida (5+ anos) em Engenharia de Dados em ambiente produtivo
- Forte domínio de Python (Pandas, PySpark, Polars ou similares) e SQL avançado
- Experiência prática com Apache Spark/Databricks, Apache Airflow e Apache Kafka/Confluent
- Vivência com cloud computing (AWS, GCP, Azure ou OCI), com aprofundamento em pelo menos uma plataforma
- Conhecimento em arquitetura Data Lakehouse
- Experiência com bancos relacionais e otimização de performance (PostgreSQL, Oracle, MySQL)
- Conhecimento em APIs, integração de dados, CDC, mensageria e containers
- Vivência com Docker, CI/CD e boas práticas de engenharia de software aplicadas a dados
- Boa comunicação técnica, colaboração e atuação em ambientes dinâmicos e orientados a produto
Beneficios
- Atuação em projeto com IA generativa e pipeline multiagente em produção
- Ambiente colaborativo em squads multidisciplinares
- Oportunidade de mentoria técnica e evolução de arquitetura