1
resposta

[Projeto] explorando probabilidades

Ao utilizar o ChatGPT para completar as frases com o prompt sugerido, iniciei com a frase "Eu tenho uma", e isto foi o que se seguiu:

  1. casa - 30%
  2. ideia - 25%
  3. amizade - 20%
  4. vida - 15%
  5. pergunta - 10%

Segui com "Eu tenho uma ideia":

  1. de - 40%
  2. sobre - 30%
  3. para - 15%
  4. que - 10%
  5. melhor - 5%

Acrescentei "sobre":

  1. como - 35%
  2. o - 25%
  3. o que - 15%
  4. um - 10%
  5. isso - 10%

Inverti o prompt para que me trouxesse as palavras com menores probabilidades e segui com a mesma frase inicial:

  1. jornada - 0.01%
  2. toalha - 0.02%
  3. relâmpago - 0.03%
  4. microfone - 0.05%
  5. dúvida - 0.08%

Notei que mesmo colocando eu tenho uma, o modelo trouxe relâmpago e microfone, que claramente não se encaixam no contexto da frase. Segui com a palavra toalha:

  1. química - 0.01%
  2. sensação - 0.03%
  3. estrela - 0.05%
  4. pintura - 0.08%
  5. galáxia - 0.1%

Fácil entender porque estas são palavras com poucas chances de serem sugeridas, mas segui com química para ver onde chegaria:

  1. espacial - 0.01%
  2. elétrica - 0.02%
  3. matemática - 0.03%
  4. musical - 0.04%
  5. histórica - 0.05%

Interessante como o modelo permite tanto criar frases que fazem total sentido quanto frases que contém palavras totalmente desconexas ou sem sentido. Coloquei ambas as frases criadas no tokenizer para ver a "construção" das mesmas. A única diferença na quantidade de tokens ficou entre ideia e toalha, já que ideia utiliza apenas um token, e toalha fica separada em "toal" e "ha". Se minha professora de português do colégio visse esta separação de sílabas, teria um infarto!

Garanta sua matrícula hoje e ganhe + 2 meses grátis

Continue sua jornada tech com ainda mais tempo para aprender e evoluir

Quero aproveitar agora
1 resposta

Olá André, tudo bem?

Parabéns por compartilhar sua exploração sobre as probabilidades das palavras com o ChatGPT! Fico muito feliz em ver sua dedicação e a forma detalhada como você analisou os resultados.

É muito interessante notar como a ferramenta pode gerar tanto sequências lógicas quanto inesperadas, e sua observação sobre a tokenização da palavra "toalha" foi excelente. Realmente, a lógica dos tokens às vezes foge bastante das regras do nosso bom e velho português!

Continue com essa curiosidade e aprofundando seus conhecimentos. Se tiver qualquer outra dúvida ou descoberta, pode contar com a gente!

Bons estudos!

Sucesso

Imagem da comunidade