Top P vs. Temperature: Entenda de uma vez como controlar a criatividade da IA
Se você trabalha com LLMs (como GPT, Claude ou Llama) via API, já se deparou com dois parâmetros essenciais: Temperature e Top P. Ambos prometem controlar a "criatividade", mas eles funcionam de formas muito diferentes.
Qual usar? Como combiná-los? Aqui vai a explicação definitiva e simples.
O Básico: Como a IA pensa?
Imagine que a IA precisa completar a frase: "O cachorro correu atrás da..."
Ela calcula a probabilidade de todas as palavras do dicionário serem a próxima:
- Bola: 60% (Favorita)
- Gata: 20% (Plausível)
- Moto: 10% (Rara)
- Banana: 5% (Estranha)
- Nuvem: 0.01% (Sem sentido)
É aqui que nossos parâmetros entram em ação para decidir quem ganha.
1. Temperature (O "Humor")
A Temperatura altera a confiança da IA antes de qualquer escolha ser feita. Ela muda a distribuição das probabilidades.
- Baixa (ex: 0.2): O Congelamento. A IA fica super conservadora. Ela pega a favorita ("Bola") e aumenta a chance dela para 99%, esmagando as outras. O resultado é determinístico e focado.
- Alta (ex: 1.5): O Caos. A IA "achata" as curvas. Ela tira a vantagem da favorita e dá mais chance para as zebras ("Banana"). O resultado é criativo, mas com risco de alucinação.
Resumo: A Temperature define a "coragem" da IA em apostar no improvável.
2. Top P (O "Segurança da Balada")
Também chamado de Nucleus Sampling, o Top P atua no recorte das opções. Ele define um limite acumulado de corte.
Se você define Top P = 0.90 (90%):
A IA soma as opções do topo até bater 90%:
- Bola (60%) + Gata (20%) + Moto (10%) = 90%.
PARE!
Qualquer coisa abaixo disso (Banana, Nuvem) é excluída. A IA só pode escolher entre as três primeiras.
Resumo: O Top P define o "elenco" permitido. Ele corta a cauda de opções absurdas.
O Combate: Qual usar?
Uma analogia final para não esquecer:
- A Temperature distribui os bilhetes da rifa (dá mais chances para os favoritos ou iguala todo mundo).
- O Top P proíbe a venda de bilhetes para quem tem chance muito baixa de ganhar.
Cheat Sheet para seus Prompts:
- Código, Respostas Factuais e Extração de Dados:
- Temp: Baixa (0.0 - 0.2)
- Top P: Baixo (0.1 - 0.3)
- Chatbots de Atendimento:
- Temp: Média (0.5 - 0.7)
- Top P: Médio (0.8 - 0.9)
- Escrita Criativa e Brainstorming:
- Temp: Alta (0.8 - 1.2)
- Top P: Alto (0.9 - 1.0)
Dica de Ouro: Geralmente, altere apenas um dos dois drasticamente. Mexer nos dois ao mesmo tempo pode tornar o modelo imprevisível.
Nota: Este post foi editado com Temperature de 1.4 e Top P de 0.95.