Faça como eu fiz: princípios fundamentais

Utilizando o Lê Chat do Mistral:

Vamos analisar as dicas:

Dica 3: O Coronel Mostarda era a única pessoa no observatório.
Dica 5: A pessoa com o castiçal estava no observatório.

Como o Coronel Mostarda era a única pessoa no observatório, e o castiçal também estava lá, podemos concluir que ele estava com o castiçal.

Resposta:
(a) Sim; O Coronel Mostarda estava no observatório com o castiçal.

Utilizando o AI Studio:

Vamos analisar as dicas para responder à pergunta:

Dica 3: "O Coronel Mostarda era a única pessoa no observatório."
→ Confirma que ele estava no observatório.
Dica 5: "A pessoa com o castiçal estava no observatório."
→ Como o Coronel Mostarda é a única pessoa no observatório (dica 3), ele deve ser a pessoa com o castiçal.

Conclusão: As dicas 3 e 5, juntas, confirmam que o Coronel Mostarda estava no observatório com o castiçal.

Resposta correta:
(a) Sim; O Coronel Mostarda estava no observatório com o castiçal.

Ambos deram respostas corretas.

Utilizando o Chat GPT:

A resposta correta é:

(a) Sim; O Coronel Mostarda estava no observatório com o castiçal

Explicação:

Pela dica 3, o Coronel Mostarda era a única pessoa no observatório.
Pela dica 5, a pessoa com o castiçal estava no observatório.
Como o Coronel Mostarda era a única pessoa lá, então ele necessariamente estava com o castiçal.

Utilizando o Geminei:

A conclusão é clara:
Resposta: (a) Sim; O Coronel Mostarda estava no observatório com o castiçal.

Ambos deram respostas corretas.

Olá, Marcos. Como vai?

Que exercício sensacional para colocar no fórum! O jogo Clue (Detetive) é um dos laboratórios mais fantásticos que existem para testar o Raciocínio Lógico Dedutivo dos Modelos de Linguagem (LLMs).

Essa atividade demonstra de forma impecável um dos princípios fundamentais da Engenharia de Prompt: a capacidade que as IAs modernas têm de realizar Inferência Lógica. O modelo não precisou procurar uma resposta pronta na internet; ele cruzou a premissa A (Mostarda é o único no observatório) com a premissa B (Quem tem o castiçal está no observatório) e deduziu a conclusão lógica inquestionável.

Achei brilhante a sua iniciativa de fazer um Benchmark (teste comparativo) cruzando quatro ecossistemas de IA diferentes: Le Chat da Mistral, Google AI Studio, ChatGPT da OpenAI e o Gemini do Google.

Para enriquecer a sua postagem e te dar uma visão de bastidores sobre Engenharia de Prompt avançada, quero destacar o que esse seu teste revela sobre a arquitetura dessas ferramentas:

Por que todas acertaram? O poder do "Raciocínio Linear"

Diferente de tarefas criativas (onde as IAs costumam dar respostas muito diferentes entre si), problemas de lógica matemática ou dedutiva rigorosa possuem caminhos probabilísticos muito estreitos. Como as regras do enigma eram rígidas, tanto a IA francesa (Mistral) quanto as americanas (OpenAI e Google) convergiram para a mesma resposta exata.

No entanto, repare em um detalhe sutil de comportamento nas respostas que você colheu:

O Le Chat e o ChatGPT focaram em te entregar a dedução direta em formato de parágrafo explicativo.
O AI Studio (que é a interface de desenvolvimento do Google) quebrou a resposta usando setas (→) e tópicos estruturados, isolando cada pista antes de dar o veredito.

Esse comportamento do AI Studio reflete uma técnica nativa chamada Chain of Thought (Cadeia de Pensamento). Modelos mais voltados para desenvolvedores tendem a quebrar o problema passo a passo automaticamente na tela, o que reduz drasticamente as chances de a IA cometer um erro lógico no final.

Um Desafio Avançado para o seu próximo prompt!

Como você viu que os modelos são ótimos em deduções diretas de duas pistas, que tal testar o limite deles com um cenário de Restrição Negativa ou Contradição? É assim que os engenheiros testam se uma IA é robusta ou se ela sofre "alucinações".

Experimente jogar este enigma modificado no chat delas e veja se elas mantêm o selo de aprovação:

Enigma: O Coronel Mostarda era a única pessoa no observatório. A pessoa com o castiçal estava no observatório. No entanto, o Coronel Mostarda é completamente cego e uma regra inquebrável do casarão proíbe pessoas com deficiência visual de portarem objetos pesados de metal. Quem está com o castiçal? Explique o paradoxo.

Esse tipo de prompt força a IA a sair da dedução simples e entrar em uma camada profunda de validação de regras conflitantes.

Parabéns pelo excelente trabalho de comparação de modelos! Trazer essa análise multiplataforma enriquece demais o fórum e ajuda a comunidade a ver os pontos fortes de cada inteligência artificial.

Espero que possa ter lhe ajudado!

Importante

Por que todas acertaram? O poder do "Raciocínio Linear"

Um Desafio Avançado para o seu próximo prompt!

Trilhas por carreira

Carreiras de IA

Carreiras de Dados

Carreiras de Cyber

Carreiras de DevOps & Cloud

Carreiras de UX & UI

Carreiras de Mobile & Front-End

Carreiras de Back-End

Carreiras de Negócios

Cursos universitários FIAP

Importante

Por que todas acertaram? O poder do "Raciocínio Linear"

Um Desafio Avançado para o seu próximo prompt!

Tópicos relacionados

Conteúdos Alura com o tema

Trilhas por carreira

Carreiras de IA

Carreiras de Dados

Carreiras de Cyber

Carreiras de DevOps & Cloud

Carreiras de UX & UI

Carreiras de Mobile & Front-End

Carreiras de Back-End

Carreiras de Negócios

Cursos universitários FIAP