1
resposta

[Sugestão] Desafio: tratando uma base de dados

https://raw.githubusercontent.com/MARINALDOSOUZA/Pandas_Projetos/refs/heads/main/tratando_uma_base_de_dados_cursos_cadastrados

Principais funcionalidades:

Automação e Gerenciamento de Dados: O código se conecta a uma URL para obter a fonte de dados, mas gerencia de forma inteligente a versão local do arquivo, oferecendo a opção de atualizar ou criar um backup, garantindo que o histórico do dado não seja perdido.

Limpeza e Normalização de Dados: Transforma a estrutura complexa do JSON em um formato tabular simples e limpo. Ele identifica e trata dados faltantes, valores inválidos (como números negativos em contagens) e padroniza formatos, como datas e preços, para facilitar análises futuras.

Otimização de Desempenho: Otimiza o uso de memória do DataFrame, convertendo os tipos de dados para o formato mais eficiente. Essa etapa é fundamental para o desempenho em projetos com grandes volumes de dados.

Exibição Interativa: Permite que o usuário escolha entre visualizar uma amostra dos dados completos ou apenas as linhas que contêm dados válidos. O resultado é então exibido em uma tabela HTML bem formatada, proporcionando uma visualização clara e profissional.

1 resposta

Oi, Marinaldo! Como vai?

Agradeço por compartilhar seu código com a comunidade Alura.

Seu projeto está muito bem estruturado, e o cuidado com a otimização de memória e o tratamento completo dos dados chama bastante atenção. A ideia de permitir que o usuário escolha como visualizar os dados mostra uma ótima atenção à experiência prática.

Uma dica interessante para o futuro é usar o método query() do Pandas para filtrar dados de forma mais legível.
Veja este exemplo:


df_filtrado = df.query("preco > 100 and concluintes > 10")
print(df_filtrado.head())

Esse código exibe apenas os cursos com preço acima de 100 e mais de 10 concluintes. É uma forma intuitiva de aplicar filtros complexos.

Alura Conte com o apoio da comunidade Alura na sua jornada. Abraços e bons estudos!