Recorri ao Chatgpt para me aprofundar sobre o conceito de tokens. Ela utilizou LEGO para fazer analogia e me gerar uma melhor compreensão, o que achei excelente. Quem não ama LEGO, né?! Hahaha. A partir do entendimento, lancei esse questionamento:
"Tendo em vista o conceito de tokens, por que IAs acabam errando mãos, por exemplo?"
Resposta:
Ótima conexão — é exatamente aí que o conceito de tokens ajuda a entender o problema.
Pensando nas mãos em “modo LEGO” (tokens)
A IA não vê uma “mão” como um objeto com regras fixas (5 dedos, articulações certinhas etc.).
Ela vê algo como:
curvas
linhas
sombras
texturas
Ou seja: um monte de tokens visuais misturados.
Por que isso dá erro?
- Não existe regra rígida interna
Pra gente:
“mão = 5 dedos”
Pra IA:
“mão = padrão visual que geralmente parece assim”
Se no treino tiver imagens com:
dedos escondidos
ângulos estranhos
mãos borradas
ela aprende um padrão meio “bagunçado”.
- Tokens competindo entre si
Cada pedacinho da imagem é gerado meio que prevendo o próximo.
Então pode acontecer:
um token “puxa” pra um dedo
outro “puxa” pra outro formato
resultado: dedos a mais, fundidos ou tortos
- Falta de “consciência estrutural”
A IA não tem um modelo interno tipo:
“isso é um dedo 1, 2, 3…”
“isso conecta aqui”
Ela não monta um esqueleto primeiro.
Ela monta aparência, não estrutura real.
- Mãos são MUITO complexas
Comparado com:
céu (fácil)
parede (fácil)
Mãos têm:
muitas articulações
posições infinitas
oclusão (um dedo na frente do outro)
Isso explode a quantidade de combinações possíveis.
- Compressão da realidade
Modelos como Stable Diffusion ou DALL·E trabalham em versões “comprimidas” da imagem (latent space).
Nesse processo:
detalhes finos (como dedos) podem se perder
a IA “chuta” o resto
Resumo direto
A IA erra mãos porque:
trabalha com tokens visuais, não com “regras do corpo”
aprende probabilidades, não anatomia
gera imagem pedaço por pedaço, não como um todo estruturado
Resultado: quando a situação fica complexa (como mãos), os erros aparecem.
Quis compartilhar porque achei muito pertinente. E estou achando excelente utilizar a IA enquanto aprendo mais sobre ela, porque, apesar de ser usuária diária da ferramenta, tô mergulhando em conceitos que não fazia ideia da existência.