import pandas as pd
url = 'https://raw.githubusercontent.com/alura-cursos/pandas-conhecendo-a-biblioteca/main/desafios/alunos.csv'
df = pd.read_csv(url)
# print(df)
### Vendo se a base de dados tem dados nulos
# print(df.isnull())
df = df.dropna(axis=0) # Removendo dados nulos
# print(df.isnull()) #testando para ver se funcionou
### Removendo alunos (Alice, Carlos) que não fazem mais parte da base de dados.
print(df)
index_alunos = df.query('Nome == "Alice" or Nome == "Carlos"').index
# não posso usar and ao inves de or por que a condição nunca será verdadeira.
# print(index_alunos)
df.drop(index_alunos, axis=0, inplace=True)
### Aplique um filtro que selecione apenas os alunos aprovados
# alunos_aprovados = df.query('Aprovado == "True"'), não funciona por que True é um valor
#booleano e não uma string.
alunos_aprovados = df.query('Aprovado == True')
print(alunos_aprovados)
### Extra: as notas 7 ficarão sendo 8 por que tem um ponto extra. Usar metodo replace
alunos_aprovados = alunos_aprovados.replace(7.0, 8.0)
### Salve o DataFrame que selecionou apenas os alunos aprovados em um arquivo csv
alunos_aprovados.to_csv('alunos_aprovados.csv', index=False)