Importante

Você está vendo a versão anterior da nova experiência da Alura que estamos preparando para você. Em breve, ela ganha uma identidade visual novinha totalmente pensada em potencializar seus estudos!

2
respostas

analise que tipos de dados ela contém. ( Excel)

o arquivo que você enviou e ele é um conjunto de dados simples de desempenho escolar. Vou te explicar de forma direta os tipos de dados que ele contém:

  1. Estrutura geral
    A tabela tem colunas que representam:

Nome do aluno
Notas de provas
Nota final (ainda não preenchida)

  1. Tipos de dados identificados

Aluno → texto (string / object)
Exemplo: “Marcelo Barbosa”
Tipo qualitativo (categórico nominal)
Prova 1, Prova 2, Prova 3, Prova 4 → números decimais (float)
Exemplo: 6.5, 8.3, 9.2
Tipo quantitativo contínuo (permite casas decimais)
Nota final → número decimal (float), mas com valores ausentes
Está como NaN (não preenchido)
Também é quantitativo contínuo, mas atualmente incompleto

  1. Observações importantes

Os dados são estruturados (tabulares) — ideais para análise em Excel, Python, etc.
Há valores faltantes na coluna “Nota final”
As notas já estão prontas para cálculos (média, classificação, etc.)

  1. Resumo prático
    Você tem aqui:

1 variável categórica (Aluno)
5 variáveis numéricas contínuas (as provas + nota final)

calcular a média aritmética das notas de cada um dos alunos.
Observações importantes:

A média foi calculada corretamente mesmo com a coluna “Nota final” vazia (ela não interfere).
O arquivo tem várias linhas vazias no final — por isso aparecem médias como “NaN” nelas (sem dados).

2 respostas

O sistema facilita a vida de profissionais, otimizando tempo.

Oi, Michele! Como vai?

Agradeço por compartilhar suas reflexões e aprendizados com a comunidade Alura.

Sua análise ficou muito boa e organizada. Você identificou corretamente os tipos de dados da planilha e explicou de forma clara a diferença entre dados categóricos e quantitativos contínuos. A observação sobre os valores NaN também está correta, pois eles representam células vazias e não entram no cálculo da média quando a ferramenta ignora valores ausentes.

Veja este exemplo:


import pandas as pd

df = pd.read_excel("notas.xlsx")

df["Media"] = df[["Prova 1", "Prova 2", "Prova 3", "Prova 4"]].mean(axis=1)

print(df[["Aluno", "Media"]])

Esse código lê a planilha, calcula a média aritmética das quatro provas de cada aluno e cria uma nova coluna chamada Media. O parametro axis=1 indica que o calculo sera feito linha por linha.

Espero ter ajudado. Conte com o apoio do Fórum na sua jornada. Fico à disposição.

Abraços e bons estudos!

Caso este post tenha lhe ajudado, por favor, marcar como solucionado