2
respostas

[Projeto] Mão na massa: analisando planilha e gerando gráficos

Parte 1:

Prompt 1:

Preciso de uma análise do arquivo em CSV que estou enviando. Do que o arquivo se trata e quais tipos de dados contem?

Resposta:

O arquivo é um CSV com dados de desempenho de alunos — basicamente um boletim digital.

Ele tem 999 linhas e 6 colunas, mas na prática só as 20 primeiras linhas contêm dados válidos; o resto parece ser espaço vazio ou ruído (provavelmente resultado de exportação errada do Excel, clássico).

As colunas são:

Aluno: nome do estudante

Prova 1 a Prova 4: notas das quatro avaliações (valores numéricos decimais)

Nota final: coluna presente, mas vazia em todas as linhas

Resumindo: é uma planilha de notas de 20 alunos, mas com um monte de linhas em branco e sem cálculo final.

Quer que eu limpe esse arquivo (tirar as linhas vazias e calcular a média final)?

Prompt 2:

Quero sim, além disso você pode fazer uma análise dos dados criando gráficos, como o de dispersão das médias dos estudantes, por exemplo, e o que mais achar relevante? Também explique os resultados das análises. Considere que a media minima para aprovação é 6.0

Resultado:

Dispersão das médias dos estudantes
Distribuição das médias
Média por prova
Distribuição das notas por prova
Correlação entre provas
Resumo por prova
Top 5 alunos
Bottom 5 alunos

Garanta sua matrícula hoje e ganhe + 2 meses grátis

Continue sua jornada tech com ainda mais tempo para aprender e evoluir

Quero aproveitar agora
2 respostas

Parte 2:

Não coube tudo em um só comentário. Aqui está o restante da análise feita pelo chatGPT (mais uma vez, o chatGPT todo cheio de piadinhas comigo. Ele aprendeu a me agradar e as vezes isso é bom mas as vezes é assustador kkkk. Quando quero algo mais formal, eu informo isso, o que não foi o caso nessa tarefa.)

Continuação:

Beleza, Laís. Limpei teu CSV, calculei as médias, marquei quem passou/reprovou e gerei alguns gráficos para enxergar o cenário sem ter que invocar os espíritos do Excel. Arquivo limpo aqui: Download do CSV limpo.

O que fiz

Removi as linhas inúteis que tinham vindo “de brinde” na exportação.

Converti as colunas Prova 1 a Prova 4 para número.

Calculei a média por aluno e escrevi na coluna “Nota final”.

Classifiquei cada aluno como Aprovado ou Reprovado considerando média mínima 6.0.

Plotei: dispersão das médias, histograma das médias, média por prova, boxplot por prova e uma matriz de correlação entre provas.

Te mostrei tabelas interativas com Resumo por prova, Top 5 e Bottom 5. Porque nada diz “motivação” como um ranking.

Números principais

Alunos avaliados: 20

Média geral: 6.09 | Mediana: 6.38 | Desvio padrão: 1.28

Melhor média individual: 7.80 | Pior: 3.05

Aprovados: 13 | Reprovados: 7 | Taxa de aprovação: 65%

Por prova

Médias: P1 6.54, P2 5.00, P3 6.66, P4 6.13

Desvios-padrão: P1 2.65, P2 2.92, P3 2.15, P4 2.83

Tradução para humano ocupado: Prova 3 foi a mais “amiga” e Prova 2 foi a vilã. A variabilidade mais alta também ficou em P2, o que sugere que ela separou quem estava estudando de quem foi por intuição e cafeína.

O que os gráficos contam

Dispersão das médias: a linha pontilhada em 6.0 divide os mundos. Há um grupinho sólido de aprovados entre 6.2 e 7.8 e um bloco pequeno, mas nítido, abaixo de 6.0. A turma não está em caos total, só com alguns outliers puxando para baixo.

Histograma das médias: distribuição levemente concentrada entre 6 e 7. Aqui vive o grosso da turma. Nada de bimodalidade estranha.

Média por prova (barras): P3 no topo, P2 no rodapé. Se isso foi proposital, parabéns pelo design instrucional; se foi acidente, deu a mesma moral do design.

Boxplot por prova: P2 e P4 têm caudas longas para baixo e mediana menor. P3 tem a distribuição mais compacta e confortável.

Correlação entre provas: fraca no geral. Nada acima de ~0.3 entre pares. Em português claro: não dá para “chutar” o desempenho de um aluno em P3 só olhando P1, então as provas provavelmente cobriram competências diferentes. Didaticamente lindo, estatisticamente chato para quem queria um preditor simples.

Quem brilhou e quem sofreu

Abri duas tabelas para você: Top 5 e Bottom 5. Em resumo, o topo está todo acima de 7.0, consistente. O fundo do poço é dominado por médias entre 3.0 e 5.0, quase sempre afundadas por notas ruins em P2/P4.

O que eu faria com isso (sem rodeios)

Revisar a Prova 2: dificuldade x avaliação. Se o objetivo era discriminar, conseguiu. Se a intenção era medir aprendizagem básica, pode ter pesado a mão.

Apoio direcionado: quem ficou com média entre 5.0 e 5.9 é o público perfeito para revisão e reforço. Pequenos ganhos empurram essa galera para aprovação.

Estratégia de estudo por competência: baixa correlação sugere competências diferentes. Vale mapear conteúdos por prova e orientar quem foi mal em P2 especificamente nesses tópicos.

Avaliação contínua: já que P3 funciona como “termômetro justo”, usar itens no estilo de P3 em listas de treino pode aumentar a confiança e reduzir variância.

Tabelas exibidas:

Resumo por prova

Top 5 alunos

Bottom 5 alunos

Gráficos exibidos:

Dispersão das médias

Histograma das médias

Barras de média por prova

Boxplot por prova

Matriz de correlação

Olá Laís, tudo bem?

Que projeto espetacular! Fiquei muito impressionado com a forma como você conduziu a análise, desde o prompt inicial de exploração e limpeza até a geração dos insights. A interação com a IA foi muito bem documentada e os resultados são super completos.

A análise que a ferramenta gerou está muito rica, cobrindo desde estatísticas descritivas até a interpretação dos gráficos e sugestões práticas. E achei o máximo o tom informal e com "piadinhas" que o ChatGPT usou com você, tornando a leitura bem mais leve e divertida!

Parabéns por aplicar o conteúdo do curso de forma tão aprofundada e por compartilhar um resultado tão bem-estruturado e visualmente rico com a gente!

Bons estudos!

Sucesso

Imagem da comunidade