123Vagas
Vagas Vagas Remotas Vagas Hibridas Cidades Empresas Blog
Publicar Vaga

Engenheiro(a) de Dados & IA Sênior | Pipeline de IA Generativa | Híbrido (São Paulo/SP)

Hibrido CLT Tecnologia

Skills

Python SQL avançado Apache Spark/Databricks

Sobre a Vaga

Estamos buscando um(a) Engenheiro(a) de Dados & IA Sênior para atuar em um projeto de automação de processos internos com IA generativa. Você fará parte de um pipeline multiagente em produção, com integrações entre diferentes sistemas e modelos de última geração.

Responsabilidades

  • Projetar e implementar pipelines de dados batch e streaming para alimentar soluções de IA, analytics e dashboards
  • Desenvolver e manter arquiteturas Data Lakehouse (Bronze, Silver e Gold) com tecnologias como Iceberg, Delta Lake ou Hudi
  • Construir integrações com bancos relacionais, APIs, sistemas legados, mensageria e ambientes cloud
  • Assegurar qualidade, governança, observabilidade e performance dos pipelines em produção
  • Estruturar pipelines para IA Generativa, incluindo chunking, embeddings, indexação semântica e recuperação de contexto (RAG)
  • Operar e otimizar ambientes de Vector Databases
  • Contribuir com iniciativas de MLOps/DataOps, feature stores e preparação de datasets para treinamento e avaliação
  • Aplicar práticas de segurança, compliance com LGPD, lineage e documentação técnica
  • Atuar em squads multidisciplinares, apoiando entregas para clientes enterprise
  • Realizar mentorias técnicas e apoiar a evolução da arquitetura e a disseminação de conhecimento no time

Requisitos

  • Experiência sólida (5+ anos) em Engenharia de Dados em ambiente produtivo
  • Forte domínio de Python (Pandas, PySpark, Polars ou similares) e SQL avançado
  • Experiência prática com Apache Spark/Databricks, Apache Airflow e Apache Kafka/Confluent
  • Vivência com cloud computing (AWS, GCP, Azure ou OCI), com aprofundamento em pelo menos uma plataforma
  • Conhecimento em arquitetura Data Lakehouse
  • Experiência com bancos relacionais e otimização de performance (PostgreSQL, Oracle, MySQL)
  • Conhecimento em APIs, integração de dados, CDC, mensageria e containers
  • Vivência com Docker, CI/CD e boas práticas de engenharia de software aplicadas a dados
  • Boa comunicação técnica, colaboração e atuação em ambientes dinâmicos e orientados a produto

Beneficios

  • Atuação em projeto com IA generativa e pipeline multiagente em produção
  • Ambiente colaborativo em squads multidisciplinares
  • Oportunidade de mentoria técnica e evolução de arquitetura
Publicada em 27 de maio de 2026
Compartilhar:
Candidatar-se