Prompt: Eu quero muito
- saber (40%)
- ir (20%)
- agradecer (15%)
- ver (10%)
- mais (5%)
Prompt: Eu quero muito
Olá, Marcos. Como vai?
Que exercício interessante você trouxe para o fórum! Embora pareça simples à primeira vista, o seu post toca no coração tecnológico de como as Inteligências Computacionais e os Modelos de Linguagem (LLMs, como o ChatGPT) funcionam por trás dos panos.
O que você esquematizou com essas porcentagens é exatamente o conceito de Probabilidade de Próximo Token (Next-Token Prediction).
A IA generativa não "pensa" como um ser humano e nem escolhe palavras graciosamente por causa do significado delas em si. Na verdade, ela funciona como um corretor ortográfico extremamente avançado do seu celular. Com base no histórico de tudo o que foi escrito antes (o contexto), ela calcula matematicamente qual é a palavra (ou pedaço de palavra, que chamamos de token) que tem a maior chance estatística de aparecer em seguida.
Se o prompt inicial enviado pelo usuário fosse apenas a frase "Eu quero muito", a rede neural do modelo faria um cálculo de distribuição de probabilidade baseado em todo o seu treinamento prévio. A tabela que você montou ilustra perfeitamente as decisões do algoritmo:
Sabia que na Engenharia de Prompt avançada nós conseguimos controlar como a IA lida com essas porcentagens que você postou? Existe uma configuração técnica nos bastidores dos modelos chamada Temperatura:
Parabéns por trazer um exercício que demonstra a lógica matemática e estatística por trás da inteligência artificial generativa. É entendendo essa engrenagem de probabilidades que passamos a escrever prompts muito mais precisos e previsíveis!
Espero que possa ter lhe ajudado!