OBS: Em virtude de costume, uso o VSCODE e o próprio hardware, que se limitou as 'explosões' do df. Ou seja, tive de 'improvisar'.
Este projeto Python foca no processamento e otimização de dados de hospedagem, transformando um arquivo JSON bruto em um DataFrame Pandas limpo, padronizado e eficiente em memória.
O código realiza o download dos dados, extrai informações de uma estrutura JSON aninhada e as padroniza. Um dos destaques é o tratamento inteligente de colunas numéricas e textuais: ele converte dados de preço e taxas para um formato float eficiente, e preenche informações de quantidade com zeros, tudo isso inferindo o menor tipo de dado para máxima economia de RAM. As descrições e comodidades são limpas, padronizadas e mantidas como strings únicas, evitando o aumento desnecessário de linhas. O projeto também inclui um robusto sistema de backup, garantindo a segurança dos dados processados, e utiliza logging detalhado para monitorar todas as etapas. O resultado é um DataFrame pronto para análise, otimizado para ambientes com pouca memória, e exibido em um formato HTML interativo para fácil visualização.