0
respostas

Top P vs. Temperature: Entenda como controlar a criatividade da IA

Top P vs. Temperature: Entenda de uma vez como controlar a criatividade da IA

Se você trabalha com LLMs (como GPT, Claude ou Llama) via API, já se deparou com dois parâmetros essenciais: Temperature e Top P. Ambos prometem controlar a "criatividade", mas eles funcionam de formas muito diferentes.

Qual usar? Como combiná-los? Aqui vai a explicação definitiva e simples.


O Básico: Como a IA pensa?

Imagine que a IA precisa completar a frase: "O cachorro correu atrás da..."
Ela calcula a probabilidade de todas as palavras do dicionário serem a próxima:

  1. Bola: 60% (Favorita)
  2. Gata: 20% (Plausível)
  3. Moto: 10% (Rara)
  4. Banana: 5% (Estranha)
  5. Nuvem: 0.01% (Sem sentido)

É aqui que nossos parâmetros entram em ação para decidir quem ganha.


1. Temperature (O "Humor")

A Temperatura altera a confiança da IA antes de qualquer escolha ser feita. Ela muda a distribuição das probabilidades.

  • Baixa (ex: 0.2): O Congelamento. A IA fica super conservadora. Ela pega a favorita ("Bola") e aumenta a chance dela para 99%, esmagando as outras. O resultado é determinístico e focado.
  • Alta (ex: 1.5): O Caos. A IA "achata" as curvas. Ela tira a vantagem da favorita e dá mais chance para as zebras ("Banana"). O resultado é criativo, mas com risco de alucinação.

Resumo: A Temperature define a "coragem" da IA em apostar no improvável.


2. Top P (O "Segurança da Balada")

Também chamado de Nucleus Sampling, o Top P atua no recorte das opções. Ele define um limite acumulado de corte.

Se você define Top P = 0.90 (90%):
A IA soma as opções do topo até bater 90%:

  • Bola (60%) + Gata (20%) + Moto (10%) = 90%.
    PARE!

Qualquer coisa abaixo disso (Banana, Nuvem) é excluída. A IA só pode escolher entre as três primeiras.

Resumo: O Top P define o "elenco" permitido. Ele corta a cauda de opções absurdas.


O Combate: Qual usar?

Uma analogia final para não esquecer:

  • A Temperature distribui os bilhetes da rifa (dá mais chances para os favoritos ou iguala todo mundo).
  • O Top P proíbe a venda de bilhetes para quem tem chance muito baixa de ganhar.

Cheat Sheet para seus Prompts:

  1. Código, Respostas Factuais e Extração de Dados:
    • Temp: Baixa (0.0 - 0.2)
    • Top P: Baixo (0.1 - 0.3)
  2. Chatbots de Atendimento:
    • Temp: Média (0.5 - 0.7)
    • Top P: Médio (0.8 - 0.9)
  3. Escrita Criativa e Brainstorming:
    • Temp: Alta (0.8 - 1.2)
    • Top P: Alto (0.9 - 1.0)

Dica de Ouro: Geralmente, altere apenas um dos dois drasticamente. Mexer nos dois ao mesmo tempo pode tornar o modelo imprevisível.


Nota: Este post foi editado com Temperature de 1.4 e Top P de 0.95.

Matricule-se agora e aproveite até 50% OFF

O maior desconto do ano para você evoluir com a maior escola de tecnologia

QUERO APROVEITAR