Prompt:
Analise os tipos de dados contidos nessa planilha. Calcule a média aritmética, a mediana, a nota máxima, a menor nota, os quartis e o desvio padrão dos alunos. Depois gere um gráfico de dispersão das médias dos estudantes.
Resultado:
Perfeito, Vitor
A planilha contém 20 alunos, cada um com notas em quatro provas e uma coluna de “Nota final”, que está vazia (sem dados).
Aqui está um resumo inicial:
Colunas:
Aluno
,Prova 1
,Prova 2
,Prova 3
,Prova 4
,Nota final
Tipo dos dados:
Aluno
: categórico (nominal)Prova 1–4
: numérico contínuo (float)Nota final
: numérico (float), mas sem valores preenchidos
Vamos agora:
- Calcular a média aritmética, mediana, nota máxima, mínima, quartis e desvio padrão das notas de cada aluno.
- Criar um gráfico de dispersão mostrando a média das provas por aluno.
Parece que não consigo executar análises de dados avançadas neste momento.
Por favor, tente novamente em instantes para que eu possa gerar as estatísticas e o gráfico de dispersão das médias dos alunos.
Se quiser, posso te mostrar o código completo em Python que faz todos esses cálculos e o gráfico — assim você pode rodar direto no seu RStudio (usando Python via reticulate) ou no Jupyter Notebook. Quer que eu te mostre esse código?
Prompt:
Faz isso.
Resultado:
Perfeito, Vitor
Aqui está o código em Python .
Esse script:
1. Lê o arquivo CSV com as notas;
2. Limpa as linhas vazias;
3. Calcula média, mediana, nota máxima, mínima, quartis e desvio padrão;
4. Exibe as estatísticas e o gráfico de dispersão das médias.
# -*- coding: utf-8 -*-
# Análise das notas dos alunos
import pandas as pd
import matplotlib.pyplot as plt
# Caminho do arquivo
file_path = "Média de notas.csv"
# Tentar abrir o arquivo com codificação apropriada
df = pd.read_csv(file_path, encoding="latin1")
# Remover linhas vazias
df = df.dropna(subset=["Aluno"])
# Calcular a média de cada aluno
df["Média"] = df[["Prova 1", "Prova 2", "Prova 3", "Prova 4"]].mean(axis=1)
# Estatísticas descritivas
media_geral = df["Média"].mean()
mediana = df["Média"].median()
nota_max = df["Média"].max()
nota_min = df["Média"].min()
quartis = df["Média"].quantile([0.25, 0.5, 0.75])
desvio_padrao = df["Média"].std()
# Exibir resultados
print("=== Estatísticas das Médias ===")
print(f"Média geral: {media_geral:.2f}")
print(f"Mediana: {mediana:.2f}")
print(f"Nota máxima: {nota_max:.2f}")
print(f"Nota mínima: {nota_min:.2f}")
print(f"1º quartil: {quartis[0.25]:.2f}")
print(f"3º quartil: {quartis[0.75]:.2f}")
print(f"Desvio padrão: {desvio_padrao:.2f}")
# Gráfico de dispersão das médias
plt.figure(figsize=(10, 6))
plt.scatter(range(len(df)), df["Média"], color="blue", edgecolor="black")
plt.xticks(range(len(df)), df["Aluno"], rotation=90)
plt.title("Gráfico de Dispersão das Médias dos Alunos")
plt.xlabel("Aluno")
plt.ylabel("Média das Provas")
plt.grid(True, linestyle="--", alpha=0.6)
plt.tight_layout()
plt.show()
Prompt:
Como eu faria esse gráfico no excel?
Resultado:
Excelente pergunta, Vitor
Fazer o gráfico de dispersão das médias dos alunos no Excel é bem simples.
Vou te explicar o passo a passo completo
1. Calcular a média dos alunos
Se suas colunas são assim:
| Aluno | Prova 1 | Prova 2 | Prova 3 | Prova 4 |
Adicione uma nova coluna chamada “Média” (por exemplo, na coluna F).
Na célula F2, digite a fórmula:
excel =MÉDIA(B2:E2)
Depois arraste a fórmula para baixo até o último aluno.
2. Criar o gráfico de dispersão
Selecione as colunas Aluno e Média.
- Exemplo: selecione o intervalo
A1:F21
(ou apenasA1:A21
eF1:F21
se preferir).
- Exemplo: selecione o intervalo
Vá até o menu Inserir → Gráficos de Dispersão (X, Y) → escolha Dispersão simples (pontos).
O Excel vai gerar um gráfico com os nomes no eixo X e as médias no eixo Y.
3. Ajustar o gráfico
Clique com o botão direito no eixo X → Formatar Eixo → marque Rótulos do eixo nas categorias (para mostrar os nomes dos alunos).
Adicione título:
- Clique em “Título do gráfico” e escreva → “Gráfico de Dispersão das Médias dos Alunos”
Eixos:
- Eixo X: “Aluno”
- Eixo Y: “Média das Provas”
Se quiser, adicione uma linha de tendência:
- Clique em um ponto → Adicionar linha de tendência → tipo Linear.
Dica opcional
Se quiser ver os pontos mais altos e baixos com destaque:
1. Clique nos pontos → botão direito → Formatar série de dados.
2. Altere a cor ou o tamanho dos marcadores.
3. Você pode até usar cores diferentes para médias acima ou abaixo de um limite (como 7,0).
Quer que eu te mostre como fazer esse mesmo gráfico no Excel com um gráfico de colunas (barras verticais), que costuma ser mais intuitivo para comparar notas?