Importante

Você está vendo a versão anterior da nova experiência da Alura que estamos preparando para você. Em breve, ela ganha uma identidade visual novinha totalmente pensada em potencializar seus estudos!

1
resposta

Desafio: bora praticar?

import pandas as pd

df = pd.read_csv("alunos.csv")

print("Primeiras 7 linhas:")
print(df.head(7))

print("\nÚltimas 5 linhas:")
print(df.tail(5))

print("\nDimensões do DataFrame (linhas, colunas):")
print(df.shape)

print("\nColunas do DataFrame:")
print(df.columns)

print("\nTipos de dados em cada coluna:")
print(df.dtypes)

print("\nEstatísticas descritivas:")
print(df.describe())

Primeiras 7 linhas (df.head(7)):

   Nome  Idade  Notas  Aprovado

0 Ary 20 7.5 True
1 Ana 18 NaN False
2 Cátia 27 2.5 False
3 Denis 18 5.0 False
4 Beto 21 10.0 True
5 Bruna 23 NaN False
6 Dara 21 7.0 True

Últimas 5 linhas (df.tail(5)):

    Nome  Idade  Notas  Aprovado

12 Sthefanie 26 9.5 True
13 Mirla 25 9.0 True
14 Paulo 37 NaN False
15 Mylena 29 7.0 True
16 Nadia 34 8.0 True

1 resposta

Oi, Penha! Como vai?

Agradeço por compartilhar seu código com a comunidade Alura.

Você realizou bem a exploração inicial do DataFrame, utilizando métodos fundamentais como head(), tail(), shape, columns, dtypes e describe(). O uso do import pandas as pd seguido da leitura do arquivo com read_csv() já demonstra um entendimento do fluxo básico de análise de dados.

Vale destacar que você utilizou corretamente o df.head(7) para exibir as primeiras linhas da base, e o df.tail(5) para visualizar as últimas linhas. Observar os valores True e False na coluna Aprovado, junto com os valores NaN na coluna Notas, é um passo importante para entender a qualidade dos dados antes de qualquer tratamento. As colunas Nome, Idade, Notas e Aprovado já revelam bastante sobre a estrutura do dataset.

Uma dica interessante para o futuro é utilizar o método info() para obter um resumo geral do DataFrame, incluindo a quantidade de valores não nulos em cada coluna:


df.info()

Esse método exibe informações sobre as colunas, os tipos de dados e a quantidade de registros preenchidos, ajudando bastante na etapa inicial de análise dos dados e facilitando a identificação de colunas com valores ausentes, como acontece com a coluna Notas nesse desafio.

Qual dessas informações exibidas você achou mais útil para entender melhor a base de dados?

Alura Conte com o apoio da comunidade Alura na sua jornada. Abraços e bons estudos!