Desafio: Prática

Desafio: Prática

1 - Verifique se a base de dados possui dados nulos e, caso tenha, realize o tratamento desses dados nulos da forma que achar mais coerente com a situação.

# Importando o csv
import pandas as pd
url = 'https://raw.githubusercontent.com/alura-cursos/pandas-conhecendo-a-biblioteca/main/desafios/alunos.csv'
pd.read_csv(url)

dados_alunos = pd.read_csv(url)

# Verificando se possui dados nulos ou não
dados_alunos.isnull()

# Substituindo o null por 0 utilizando o método fillna()
dados_alunos = dados_alunos.fillna(0)
dados_alunos

2 - Os alunos "Alice" e "Carlos", não fazem mais parte da turma. Sendo assim, remova-os da base de dados.

# removendo as linhas que contem Alice e Carlos
dados_alunos.drop([7, 8], axis = 0, inplace = True)
dados_alunos

3 - Aplique um filtro que selecione apenas os alunos que foram aprovados.

aprovados = dados_alunos['Aprovado'] == True
dados_alunos[aprovados]

4 - EXTRA: Ao conferir as notas dos alunos aprovados, notamos que algumas notas estavam incorretas. As alunas que tiraram nota 7.0, na verdade, tinham um ponto extra que não foi contabilizado. Sendo assim, substitua as notas 7.0 da base de dados por 8.0.

#Utilizando o metodo replace para trocar as notas 7 por 8
dados_alunos['Notas'] = dados_alunos['Notas'].replace(7.0, 8.0)
dados_alunos

5 - Salvando apenas os aprovados

aprovados.to_csv('alunos_aprovados.csv', index = False)

Oi, Cean! Como vai?
Agradeço por compartilhar seu código com a comunidade Alura.

Você aplicou muito bem as funções fillna() e replace() para limpar e ajustar os dados. Isso mostra domínio nas etapas de tratamento de dados com o Pandas, algo essencial para manter a base consistente antes das análises.

Uma dica interessante para o futuro é usar o método dropna() quando quiser eliminar diretamente linhas com valores nulos. Veja este exemplo:


import pandas as pd

dados = pd.DataFrame({
    'nome': ['Ana', 'Bruno', None],
    'nota': [8, None, 7]
})

dados = dados.dropna()
print(dados)

Esse código exclui todas as linhas com valores ausentes, mantendo apenas os registros completos no DataFrame.

Qualquer dúvida que surgir, compartilhe no fórum. Abraços e bons estudos!

Conte com o apoio da comunidade Alura na sua jornada. Abraços e bons estudos!

Importante

Trilhas por carreira

Carreiras de IA

Carreiras de Dados

Carreiras de Cyber

Carreiras de DevOps & Cloud

Carreiras de UX & UI

Carreiras de Mobile & Front-End

Carreiras de Back-End

Carreiras de Negócios

Cursos universitários FIAP