Skills
Google Cloud Platform (GCP)
Vertex AI e Gemini
RAG e bancos vetoriais
Sobre a Vaga
Atuamos na construção de soluções de IA para automatizar processos e criar agentes inteligentes. Como Engenheiro(a) de IA Pleno, você terá um papel estratégico no desenho, desenvolvimento e operação de sistemas baseados em modelos generativos no ecossistema Google Cloud.
Responsabilidades
- Conduzir levantamento de requisitos e alinhar visão de produto com stakeholders para identificar oportunidades de automação
- Traduzir regras de negócio em lógicas de decisão para agentes de IA e definir métricas de sucesso (KPIs)
- Arquitetar e desenvolver agentes conversacionais, incluindo sistemas multi-agentes
- Integrar agentes a APIs internas, bancos de dados e serviços de terceiros via Function Calling/Tools
- Gerenciar o ciclo de vida do agente com práticas de deploy, monitoramento de saúde, latência e manutenção em produção
- Implementar melhorias contínuas com base em feedback, logs e métricas de performance
- Garantir excelência de engenharia com código escalável e governança/segurança de dados (ex.: anonimização de PII)
- Otimizar custos e consumo de tokens das APIs e modelos utilizados
Requisitos
- Experiência sólida em Google Cloud (GCP), com foco em Cloud Run e Cloud Functions
- Conhecimento de IAM e governança de permissões no Google Cloud
- Domínio de IA Generativa com Vertex AI e modelos da família Gemini (Pro, Flash, Ultra), incluindo capacidades de texto e multimodalidade
- Experiência com Vertex AI Agent Builder e/ou frameworks como LangChain e LlamaIndex, ou orquestradores customizados
- Prática em engenharia de prompt estruturado (few-shot, ReAct, Tree of Thoughts e técnicas para reduzir alucinações e jailbreaks)
- Conhecimento avançado em RAG (chunking, embeddings, busca semântica/híbrida) e uso de bancos vetoriais (ex.: Vertex AI Vector Search, Pinecone, Milvus)
- Vivência com CI/CD, versionamento de prompts e monitoramento de performance em aplicações de IA
- Experiência em programação (Python, Node.js ou Go)
Beneficios
- Atuação em ambiente remoto
- Oportunidade de trabalhar com IA generativa e agentes em produção
- Projetos com foco em qualidade, segurança de dados e otimização de custos (FinOps)