0
respostas

[Projeto] Mão na Massa: Analise de dados com IA

  1. Visão geral dos dados e qualidade
  • Linhas do arquivo: 999.
  • Colunas detectadas relevantes: Prova 1, Prova 2, Prova 3, Prova 4 (essas são as colunas de notas).
  • Observação importante sobre qualidade: apesar de existirem 999 linhas, somente 20 entradas/valores válidos foram detectados para cada uma das provas (ou seja, apenas 20 registros com notas numéricas nas colunas Prova 1..4). Isso significa que a maior parte das linhas está com valores ausentes / formato diferente — qualquer conclusão precisa levar isso em conta. Antes de extrapolar resultados, recomendo limpar e consolidar os dados (ver recomendações abaixo).
  1. Principais estatísticas (escala 0–10)

(todas as médias e percentuais abaixo consideram apenas os valores numéricos presentes)

Média geral (média das médias por aluno): 6.09

Mediana geral (mediana das médias por aluno): 6.48

Desvio padrão médio por aluno (média dos desvios): ≈ 2.21

Média por prova

Prova 1: 6.545

Prova 2: 5.005

Prova 3: 6.665

Prova 4: 6.130

% de notas abaixo do limiar usado (limiar escolhido = 6.0)
(Escolhi 6.0 porque as notas aparentam estar na escala 0–10; se sua regra de corte for outra, posso recalcular.)

Prova 2: 60.0% das notas abaixo de 6.0

Prova 3: 40.0% abaixo de 6.0

Prova 4: 40.0% abaixo de 6.0

Prova 1: 30.0% abaixo de 6.0

Interpretação curta: Prova 2 é claramente a mais problemática — média muito mais baixa (≈5.0) e 60% das notas abaixo do limiar. As outras provas estão em torno de 6–6.7.

  1. Progressão dos alunos (Prova4 − Prova1)

Apenas 20 alunos têm valores válidos para Prova 1 e Prova 4, por isso a análise de progressão foi feita sobre esses 20.

Entre esses 20:

50% melhoraram (Δ > 0)

50% pioraram (Δ < 0)

0% ficaram exatamente iguais

Média da progressão (Prova4 − Prova1): −0.415 (leve queda média)

Top 5 maiores melhorias (Prova1 → Prova4, Δ):

Ana Paula Oliveira: 0.0 → 8.0, Δ = +8.0

Isabela da Costa: 5.2 → 9.1, Δ = +3.90

Ronaldo Santos: 7.0 → 8.9, Δ = +1.90

Marcos Vinicius Lima: 6.8 → 8.3, Δ = +1.50

Maria Eduarda Farias: 8.8 → 10.0, Δ = +1.20

Top 5 maiores quedas (Prova1 → Prova4, Δ):

João Vitor Ferreira: 8.0 → 0.0, Δ = −8.0

Rafaela Santos: 8.3 → 4.5, Δ = −3.80

Fernando Henrique Silva: 6.1 → 2.3, Δ = −3.80

Aline da Rocha: 8.5 → 5.0, Δ = −3.50

Leticia Costa: 9.9 → 7.8, Δ = −2.10

Interpretação curta: há casos extremos (ex.: Δ = ±8) que podem indicar erro de lançamento (digitou 0 por engano), ausência/faltas registradas como 0, ou problemas na entrega da prova. Esses casos merecem checagem caso a caso.

  1. Correlações entre provas (indicativo de consistência)

Matriz de correlação (coeficiente de Pearson, arredondado):

...............Prova1 Prova2 Prova3 Prova4
Prova1 1.000 0.108 0.062 0.278
Prova2 0.108 1.000 −0.292 −0.378
Prova3 0.062 −0.292 1.000 0.124
Prova4 0.278 −0.378 0.124 1.000

Interpretação: baixa correlação geral entre algumas provas; especialmente Prova 2 tem correlação negativa com Prova 3 e Prova 4, o que sugere que Prova 2 pode estar cobrindo conteúdo diferente, ter escala distinta, ou apresentar problema de aplicação/registro.

  1. Limitações importantes

Grande número de linhas sem valores numéricos nas colunas de notas: apenas 20 notas válidas por prova — isso prejudica a representatividade. Recomendo revisar o arquivo original e normalizar formatação de notas (por exemplo, vírgula vs ponto decimal, linhas extras, cabeçalhos repetidos, etc.).

Possibilidade de valores 0 que representam falta — confirme se 0 significa nota efetiva ou ausência.

Limiar (foi usado 6.0) pode não ser o padrão da sua instituição — ajuste conforme necessário.

  1. Recomendações / próximos passos

Limpeza de dados: unir colunas, remover linhas em branco, uniformizar separador decimal (substituir “,” por “.”), garantir que as colunas de nota estejam numéricas.

Verificar outliers e zeros extremos (ex.: 0 → 8 ou 8 → 0) com a secretaria/professor responsável — podem ser erros de lançamento.

Investigar Prova 2: revisar itens, critérios de correção, instruções e se houve mudança de escala.

Aumentar amostra: obter notas faltantes ou importar planilha original com formatação correta para ter mais dados confiáveis.

Análises adicionais possíveis: teste pareado (Prova1 vs Prova4), clustering de alunos por perfil, análise item-por-item (se tiver gabarito/detalhes), correlação com presença/atitude/participação.

Garanta sua matrícula hoje e ganhe + 2 meses grátis

Continue sua jornada tech com ainda mais tempo para aprender e evoluir

Quero aproveitar agora