Solucionado (ver solução)
Solucionado
(ver solução)
3
respostas

[Dúvida] Completando post com imagens

Olá!
Gostaria de compartilhar uma experiência em relação ao tema da aula, geração de imagens e receber feedbacks.
Meu contato com IA é recente e tive a ideia de pedir para gerar uma imagem de 2 crianças brincando, porém não são crianças qualquer, somos eu e minha irmã com diferença de idade de 17 anos. Então inicialmente eu fiz o upload de 2 fotos no Gemini em que estávamos com idade aproximada de 4 a 6 anos e escrevi um prompt pedindo que nos colocasse brincando na praia de Copacabana e tendo no fundo o pão de açúcar (acho que fui muito exigente). Ao clicar para gerar a imagem o Gemini me respondeu que não poderia me dar retorno por questões de segurança. Então expliquei a situação que as fotos eram eu e minha irmã e qual era o meu objetivo e novamente recebi a mesma resposta. Então pedi ao Gemini para gerar um prompt de 2 crianças brincando. Fiz então o upload das mesmas fotos e o prompt do Gemini no ChatGPT e então a imagem foi gerada. A IA nos colocou com as roupas da foto, mas a minha feição ficou um pouco diferente ao contrário da minha irmã que ficou mais parecida.
Estudando o conteúdo das aulas fiz o mesmo procedimento com o big-image e nem consegui fazer o upload das fotos, o Midjourney é totalmente pago e por fim o Yeri AI (Stuble Diffision) me gerou a imagem, porém eu e minha irmã temos pele branca e ele nos colocou com pele morena.
Minhas dúvidas:
**1) Pedir IA para gerar fotos com criança é proibido?
2) Será que meu prompt não foi adequado ou deixei de dar instrução negativa?
3) Por que a IA não gerou com as feições idênticas as das fotos?

3 respostas
solução!

Oi, Neusa! Tudo bem? Como também estou começando a explorar o mundo da IA, achei seu relato muito interessante porque ele toca em pontos reais de como essas ferramentas funcionam hoje.
Pelo que andei estudando, aqui estão as respostas para as suas dúvidas:
Sobre as crianças: É verdade, a maioria das IAs (como o Gemini) tem filtros de segurança muito rígidos para gerar imagens de crianças. Isso é uma medida de proteção ética global para evitar que a tecnologia seja usada de forma errada.
As feições diferentes: As IAs generativas não são como um filtro de foto; elas criam uma imagem 'do zero' baseada em padrões. Elas entendem o que é um rosto, mas ainda têm dificuldade em manter a identidade exata de uma pessoa específica sem um treinamento muito avançado.
O tom de pele: Isso acontece por causa do 'viés' da IA. Ela é treinada com milhões de fotos e, às vezes, acaba privilegiando certas características se o comando (prompt) não for extremamente detalhado sobre a cor da pele ou iluminação.
Sua persistência em testar várias ferramentas (ChatGPT, Gemini, Stable Diffusion) é o melhor jeito de aprender! Parabéns pelos testes

Olá Lavinia! Tudo bem?
Obrigada pelo retorno! Seu esclarecimento foi bem explicativo e me ajudou a entender ainda mais o funcionamento dos modelos de IA.
Parabéns pela sua dedicação!

Oi Neusa, eu que agradeço. continua postando, vc ajuda bastante. Bons estudos!