1
resposta

Faça como eu fiz: explorando probabilidades

Vamos simular como funciona o AISTUDIO. Para cada frase que eu escrever no prompt, você deve listar as 5 palavras com menor probabilidade que você usaria para completá-la, junto com a probabilidade de cada uma delas. Combinado? Apenas as palavras e probabilidades, sem mais nada. Me diga se você entendeu.

Entendi.

Se puder escolher uma cidade, em qualquer lugar do mundo para morar, qual seria?

Microondas: 0.0000000014%
transliterar: 0.0000000011%
betoneira: 0.0000000008%
ornitorrinco: 0.0000000004%
Klingon: 0.0000000001%

1 resposta

Olá, Paulo. Como vai?

Excelente exercício prático! O seu prompt foi muito bem construído para explorar o funcionamento dos Modelos de Linguagem (LLMs) "por trás dos panos". Forçar a IA a listar as palavras com a menor probabilidade é uma forma brilhante de entender como os conceitos de tokens e distribuição de probabilidade operam na geração de texto.

O resultado que você obteve ilustra perfeitamente a lógica dos modelos generativos. Para a pergunta "Se puder escolher uma cidade, em qualquer lugar do mundo para morar, qual seria?", palavras como "Paris", "Tóquio" ou "Nova York" teriam as maiores probabilidades de aparecer em seguida. Já palavras completamente fora do contexto semântico de geografia ou escolha pessoal — como "betoneira" ou "ornitorrinco" — recebem probabilidades que tendem a zero, exatamente como a IA listou.

Para agregar ainda mais valor ao seu experimento e conectar com o que é discutido no Google AI Studio e em outras ferramentas de desenvolvimento, vale a pena destacar dois parâmetros fundamentais que controlam esse comportamento:

1. O parâmetro Temperature (Temperatura)

A temperatura controla o nível de criatividade ou aleatoriedade das respostas:

  • Temperatura baixa (próxima de 0): O modelo se torna determinístico. Ele sempre escolherá as palavras com as maiores probabilidades da lista (as respostas mais óbvias e seguras).
  • Temperatura alta (próxima de 1 ou superior): O modelo ganha "audácia". Ele começa a considerar palavras que estão mais abaixo na lista de probabilidades. Se você aplicasse uma temperatura extremamente alta no seu prompt, a IA poderia chegar a responder a sua pergunta usando palavras aleatórias como as que você pescou no exercício.

2. O parâmetro Top-P (Nucleus Sampling)

O Top-P define o tamanho do "pool" de palavras que o modelo pode considerar com base na probabilidade acumulada. Se o Top-P estiver definido em 0.1, o modelo olhará apenas para o top 10% das palavras mais prováveis. No seu exercício, para conseguir acessar termos como "Klingon" ou "microondas", o parâmetro Top-P precisaria estar em 1.0 (permitindo que o modelo olhe para o universo completo de palavras possíveis, por menor que seja a chance delas).

O seu teste prático foi uma excelente sacada para desmistificar a IA e enxergá-la como ela realmente é: uma poderosa calculadora de probabilidades estatísticas e previsão de palavras.

Espero que possa ter lhe ajudado!