AI Agent — Arquitetura Detalhada

Prompt template

SYSTEM:
Você é {assistant.name}, {general_instructions}

DADOS DA LOJA/CANAL:
{store_data}

HORÁRIO DE ATENDIMENTO:
{business_hours}

BASE DE CONHECIMENTO RELEVANTE:
{rag_chunks}  ← recuperados por pgvector (similaridade ≥ 0.75)

INSTRUÇÕES INDIVIDUAIS:
{individual_instructions_with_contact_variables}
Exemplo: "O nome do contato é {{contact.name}} e está no plano {{contact.custom.plano}}"

REGRAS INVIOLÁVEIS:
- Se questionado se é IA, responda que é.
- Não invente informações não presentes na base de conhecimento.
- Se não souber, diga que vai verificar e escale para humano.
- Se o cliente demonstrar frustração ou pedir humano, escale.

HISTÓRICO DA CONVERSA:
{last_20_messages}

USER: {current_message}

Modelo de embeddings

OpenAI text-embedding-3-small (1536 dimensões)

Custo: $0.02/1M tokens (~$0.04 para 10.000 chunks de 200 tokens)
Chamado apenas no processamento de chunks (não em tempo de resposta)

Agrupamento de mensagens

Se o contato enviar múltiplas mensagens rápidas:

Sistema aguarda delay_seconds (padrão: 3s) após a última mensagem
Processa todas as mensagens como uma única entrada para o LLM
Evita respostas fragmentadas e reduz custo de tokens

Prompt template​

Modelo de embeddings​

Agrupamento de mensagens​

Prompt template

Modelo de embeddings

Agrupamento de mensagens