Skills
Sobre a Vaga
Buscamos um(a) Engenheiro(a) de LLMops Sênior para sustentar, evoluir e testar nossa infraestrutura de Inteligência Artificial. Você atuará para garantir alta disponibilidade, segurança e eficiência de custos das plataformas de IA, incluindo Google Gemini Enterprise, Azure Foundry e AWS Agent Core, além de AI Gateway e orquestração de agentes.
Responsabilidades
- Gerenciar e otimizar a camada de agentes e proxies com ferramentas como LiteLLM, GCP Gemini, AWS Agent Core e Azure Foundry
- Conduzir homologação e P&D de novas tecnologias do ecossistema GenAI, com testes de estresse, latência e qualidade
- Desenvolver e validar soluções práticas, incluindo MVPs e entregas internas
- Configurar e administrar gateways e componentes de RAG, incluindo rate limiting, failover e load balancing
- Gerir infraestrutura de bases vetoriais (como OpenSearch e Vertex AI Vector Search)
- Implementar observabilidade e FinOps com tracing e monitoramento para tokens, latência e otimização de custos de inferência
- Construir automações de CI/CD para IA, incluindo esteiras de avaliação de prompts (Evals) e testes de regressão
Requisitos
- Experiência com IA agêntica e gateways, com atuação prática em LiteLLM, GCP Gemini, AWS Agent Core e/ou Azure Foundry/OpenAI
- Conhecimento sólido em serviços de GenAI em AWS, Azure ou GCP, com provisionamento via Terraform
- Programação em Python (essencial para automações e integrações)
- Experiência com containers e orquestração (Docker e Kubernetes)
- Compreensão de pipelines de RAG e bancos de dados vetoriais
- Experiência com desenvolvimento assistido por IA (ex.: GitHub Copilot, Claude Code, Codex)
- Conhecimento em segurança de IA, incluindo PII masking e práticas alinhadas ao OWASP Top 10 para LLMs
Beneficios
- Atuação em ambiente multicloud com desafios reais de produção
- Oportunidade de contribuir com validação de roadmap tecnológico e evolução da stack de IA
- Foco em melhoria contínua de custos, qualidade e confiabilidade dos sistemas