Importante

Você está vendo a versão anterior da nova experiência da Alura que estamos preparando para você. Em breve, ela ganha uma identidade visual novinha totalmente pensada em potencializar seus estudos!

1
resposta

Desafio: bora praticar?

import pandas as pd

# 1. Importação do arquivo CSV:
url = 'https://raw.githubusercontent.com/alura-cursos/pandas-conhecendo-a-biblioteca/main/desafios/alunos.csv'
dados = pd.read_csv(url)

# 2. Visualização sas primeiras 7 linhas e das últimas 5:
print("Primeiras 7 linhas:")
print(dados.head(7))

print("\nÚltimas 5 linhas:")
print(dados.tail(5))

# 3. Conferência de quantidade de linhas e de colunas:
print("\nDimensões do DataFrame (linhas, colunas):")
print(dados.shape)

# 4. Exploração de colunas e de tipos de dados:
print("\nColunas e tipos de dados:")
print(dados.dtypes)

# Extra: Estatísticas descritivas:
print("\nEstatísticas descritivas:")
print(dados.describe())


Primeiras 7 linhas:
    Nome  Idade  Notas  Aprovado
0    Ary     20    7.5      True
1    Ana     18    NaN     False
2  Cátia     27    2.5     False
3  Denis     18    5.0     False
4   Beto     21   10.0      True
5  Bruna     23    NaN     False
6   Dara     21    7.0      True

Últimas 5 linhas:
      Nome  Idade  Notas  Aprovado
13   Mirla     25    9.0      True
14   Paulo     37    NaN     False
15  Mylena     29    7.0      True
16   Lucas     33    NaN     False
17   Nadia     34    8.0      True

Dimensões do DataFrame (linhas, colunas):
(18, 4)

Colunas e tipos de dados:
Nome         object
Idade         int64
Notas       float64
Aprovado       bool
dtype: object

Estatísticas descritivas:
           Idade      Notas
count  18.000000  12.000000
mean   25.500000   6.800000
std     6.070662   2.204953
min    18.000000   2.500000
25%    21.000000   5.450000
50%    24.500000   7.000000
75%    28.750000   8.250000
max    37.000000  10.000000
1 resposta

Olá, Andressa! Como vai?

Parabéns pela resolução bem estruturada!

Vi que você explorou o pandas para manipular dados em Python, utilizou muito bem o head e tail para visualizar partes do DataFrame e ainda compreendeu a importância da describe para obter estatísticas descritivas. Continue trazendo suas soluções, pois elas ajudam bastante outros estudantes e fortalecem a comunidade.

Uma dica interessante para o futuro é aplicar filtros diretamente no DataFrame para analisar subconjuntos de dados. Assim:

# Filtrar apenas alunos aprovados
aprovados = dados[dados['Aprovado'] == True]
print(aprovados)

Isso retorna apenas os registros dos alunos aprovados.

Se quiser aprofundar ainda mais, algumas boas práticas são:

  • Exploração: use .info() para verificar dados nulos e tipos.
  • Limpeza: trate valores ausentes com .fillna() ou .dropna().
  • Visualização: combine pandas com matplotlib para gráficos rápidos.

Ah, uma pergunta: você prefere trabalhar com pandas para análises rápidas em DataFrames ou com SQL para consultas estruturadas em bancos de dados maiores?

Abraço e bons estudos!

AluraConte com o apoio da comunidade Alura na sua jornada. Abraços e bons estudos!