Solucionado (ver solução)

Importante

Você está vendo a versão anterior da nova experiência da Alura que estamos preparando para você. Em breve, ela ganha uma identidade visual novinha totalmente pensada em potencializar seus estudos!

Solucionado
(ver solução)
1
resposta

[Projeto] Desafio: salvando os dados filtrados | Pandas: conhecendo a biblioteca

Para salvar os DataFrames df_1 e df_2 em arquivos CSV distintos, utilize o método to_csv() do Pandas:

df_1.to_csv('df_1.csv', index=False)
df_2.to_csv('df_2.csv', index=False)
1 resposta
solução!

Olá, Estudante. Como vai?

Excelente contribuição! O método to_csv() é fundamental no dia a dia de quem trabalha com ciência de dados, pois a exportação correta dos dados tratados garante que o resultado da nossa análise seja preservado para uso futuro ou compartilhado com outras equipes.

Para complementar o seu tópico e enriquecer o conhecimento de quem está acompanhando o desafio, vale a pena destacar o motivo de usarmos o parâmetro index=False e trazer algumas outras opções úteis desse método.

Por que usar index=False?

Por padrão, quando o Pandas cria um DataFrame, ele gera um índice numérico sequencial (0, 1, 2, 3...). Se salvarmos o arquivo sem o index=False, o Pandas vai criar uma coluna sem nome no arquivo CSV para guardar esses números. Quando tentamos ler esse arquivo novamente no futuro, o Pandas criará um novo índice e transformará o antigo em uma coluna comum (geralmente chamada de Unnamed: 0), poluindo os dados.

Outros parâmetros úteis do to_csv()

  • Alterar o separador (sep): No Brasil, como usamos a vírgula para separar números decimais (ex: 7,5), é muito comum exportar arquivos utilizando o ponto e vírgula como separador para evitar problemas ao abrir o arquivo no Excel.
df_1.to_csv('df_1_brasil.csv', sep=';', index=False)
  • Definir a codificação de caracteres (encoding): Se os seus dados possuírem acentos ou caracteres especiais (como "João", "Frequência", "Média"), salvá-los explicitamente em utf-8 garante que o arquivo não fique com as palavras quebradas ou com símbolos estranhos em outros computadores.
df_1.to_csv('df_1_codificado.csv', encoding='utf-8', index=False)
  • Selecionar colunas específicas (columns): Se você gerou um DataFrame com muitas colunas de rascunho, mas só precisa salvar algumas específicas no arquivo final, basta passar uma lista com os nomes delas.
df_1.to_csv('df_1_resumido.csv', columns=['Aluno', 'Notas'], index=False)

Parabéns por documentar essa etapa crucial do desafio de forma tão direta e prática!

Espero que possa ter lhe ajudado!