Olá, Colegas!
Vamos solucionar os problemas propostos abaixo utilizando os conhecimentos adquiridos até aqui.
import pandas as pd
# Importando a base de dados
url = 'https://raw.githubusercontent.com/alura-cursos/pandas-conhecendo-a-biblioteca/main/desafios/alunos.csv'
alunos = pd.read_csv(url)
# 1. Verificar dados nulos
print(alunos.isnull().sum())
# Tratamento dos dados nulos
# Preencher notas nulas com a média das notas
alunos['Notas'] = alunos['Notas'].fillna(alunos['Notas'].mean())
# 2. Remover Alice e Carlos
alunos = alunos.query("Nome != 'Alice' and Nome != 'Carlos'")
# 3. Filtrar apenas os alunos aprovados
alunos_aprovados = alunos.query("Aprovado == True")
# Extra: corrigir notas 7.0 para 8.0
alunos_aprovados['Notas'] = alunos_aprovados['Notas'].replace(7.0, 8.0)
# 4. Salvar os aprovados em CSV
alunos_aprovados.to_csv('alunos_aprovados.csv', index=False)
alunos_aprovados
Verificar nulos
alunos.isnull().sum()
Remover Alice e Carlos
alunos = alunos.query("Nome != 'Alice' and Nome != 'Carlos'")
Filtrar aprovados
alunos_aprovados = alunos.query("Aprovado == True")
Substituir notas
alunos_aprovados['Notas'] = alunos_aprovados['Notas'].replace(7.0, 8.0)
Exportar para CSV
alunos_aprovados.to_csv('alunos_aprovados.csv', index=False)