Oi Tereza, tudo bem?
Sua observação está certa: o .value_counts(normalize=True)
retorna uma Series, e ao aplicar .to_frame()
transformamos o resultado em um DataFrame. Visualmente, muitas vezes eles parecem iguais, mas existem alguns motivos para preferir o DataFrame em certos momentos:
Consistência com o fluxo de análise: ao longo da aula, estamos sempre manipulando DataFrames (com colunas e linhas). Converter a Series em DataFrame mantém o padrão, o que ajuda a trabalhar de forma mais uniforme no restante da análise.
Flexibilidade para operações futuras:
- Em um DataFrame, você pode facilmente renomear a coluna de valores, adicionar novas colunas (como percentuais arredondados, categorias, etc.), e fazer merge com outros DataFrames.
- Na Series isso também é possível, mas de forma mais limitada ou menos intuitiva.
Compatibilidade com métodos de visualização: muitas funções de plotagem e manipulação de dados funcionam melhor ou de forma mais clara com DataFrames, especialmente se você quiser configurar nomes de colunas, ordenar por colunas específicas, ou juntar com outros dados.
Então, não é obrigatório converter para DataFrame, mas é uma boa prática quando você pretende seguir manipulando esses dados em conjunto com outros, ou manter a consistência da sua análise.
Espero ter ajudado.
Qualquer dúvida que surgir, compartilhe no fórum. Abraços e bons estudos!
Caso este post tenha lhe ajudado, por favor, marcar como solucionado ✓. Bons Estudos!