123Vagas
Vagas Vagas Remotas Vagas Híbridas Cidades Empresas Skills Blog Salários
Entrar / Criar conta
GF

Engenheiro(a) de LLMops Sênior | Multicloud | Híbrido (Barueri/SP)

Híbrido CLT Tecnologia
LLMOps LiteLLM RAG e bancos de dados vetoriais Terraform Python Kubernetes Observabilidade e FinOps CI/CD para IA Segurança de IA (OWASP Top 10 para LLMs, PII masking)

Sobre a Vaga

Buscamos um(a) Engenheiro(a) de LLMops Sênior para sustentar, evoluir e testar nossa infraestrutura de Inteligência Artificial. Você atuará para garantir alta disponibilidade, segurança e eficiência de custos das plataformas de IA, incluindo Google Gemini Enterprise, Azure Foundry e AWS Agent Core, além de AI Gateway e orquestração de agentes.

Responsabilidades

  • Gerenciar e otimizar a camada de agentes e proxies com ferramentas como LiteLLM, GCP Gemini, AWS Agent Core e Azure Foundry
  • Conduzir homologação e P&D de novas tecnologias do ecossistema GenAI, com testes de estresse, latência e qualidade
  • Desenvolver e validar soluções práticas, incluindo MVPs e entregas internas
  • Configurar e administrar gateways e componentes de RAG, incluindo rate limiting, failover e load balancing
  • Gerir infraestrutura de bases vetoriais (como OpenSearch e Vertex AI Vector Search)
  • Implementar observabilidade e FinOps com tracing e monitoramento para tokens, latência e otimização de custos de inferência
  • Construir automações de CI/CD para IA, incluindo esteiras de avaliação de prompts (Evals) e testes de regressão

Requisitos

  • Experiência com IA agêntica e gateways, com atuação prática em LiteLLM, GCP Gemini, AWS Agent Core e/ou Azure Foundry/OpenAI
  • Conhecimento sólido em serviços de GenAI em AWS, Azure ou GCP, com provisionamento via Terraform
  • Programação em Python (essencial para automações e integrações)
  • Experiência com containers e orquestração (Docker e Kubernetes)
  • Compreensão de pipelines de RAG e bancos de dados vetoriais
  • Experiência com desenvolvimento assistido por IA (ex.: GitHub Copilot, Claude Code, Codex)
  • Conhecimento em segurança de IA, incluindo PII masking e práticas alinhadas ao OWASP Top 10 para LLMs

Beneficios

  • Atuação em ambiente multicloud com desafios reais de produção
  • Oportunidade de contribuir com validação de roadmap tecnológico e evolução da stack de IA
  • Foco em melhoria contínua de custos, qualidade e confiabilidade dos sistemas
Publicada em 11 de junho de 2026
Compartilhar:
Candidatar-se