1
resposta

Atividade Alura - processamento dos dados

https://colab.research.google.com/drive/1h1DB9tKFQnuF7vzJoVTVd0Rb35aNX5Fz?usp=sharing

**Foi realizado o carregamento dos dados diretamente de uma fonte externa (GitHub) utilizando a biblioteca Pandas, seguido de uma análise inicial da estrutura do DataFrame.

Em seguida, foi feita a verificação de valores nulos, identificando ausência de dados nas colunas de temperatura e sensação térmica. Considerando que os dados possuem natureza temporal, optei por aplicar interpolação linear para preencher os valores ausentes, evitando a perda de informações e mantendo a continuidade da série.

Também foram identificados registros duplicados, o que não é esperado em dados coletados por hora. Dessa forma, os duplicados foram removidos para garantir a consistência do conjunto de dados.

Após o tratamento, o dataset resultante apresenta dados mais limpos e confiáveis, sendo adequado para análises e modelagens futuras.

Durante o processo, utilizei a IA como suporte para validar boas práticas e estruturar melhor o código, mantendo o foco na compreensão das etapas de tratamento de dados.**

1 resposta

Olá, Hewerson! Como vai?

Agradeço por compartilhar suas reflexões e aprendizados com a comunidade Alura.

Muito bem! Gostei da sua análise, você tratou be, os dados temporais com interpolação linear e na preocupação em remover duplicados para garantir a consistência do dataset. Isso mostra um bom entendimento de pré-processamento de dados, que é uma etapa importante antes de qualquer modelagem.

Continue seguindo esse caminho, pois essa atenção aos detalhes faz diferença na qualidade das análises. ✨

Conte com o apoio do Fórum na sua jornada. Abraços e bons estudos!

Alura Conte com o apoio da comunidade Alura na sua jornada. Abraços e bons estudos!