3
respostas

[Dúvida] Dados ataulizados

Onde eu posso pegar uma base de dados um pouco atualizada para fazer mais sentido, pois essa inicia de 2020.

3 respostas

Olá, William! Tudo bem?

Excelente iniciativa. Buscar dados atualizados ou de contextos diferentes fortalece muito o portfólio e amplia o aprendizado.

Só para alinhar com o curso: embora a base comece em 2020, os dados disponibilizados vão até fevereiro de 2024, como aparece no final do dataframe mostrado em aula. Ou seja, já temos um histórico bem recente para treinar e validar o modelo.

Se você quiser explorar outras fontes, o que é ótimo para testar a robustez do Prophet, existem boas opções. O World Air Quality Index (WAQI) oferece dados históricos de milhares de estações ao redor do mundo em aqicn.org. No Kaggle, você pode pesquisar por “Air Quality Time Series” ou “Pollution Data” e encontrar bases prontas para uso. No Brasil, a CETESB disponibiliza dados históricos pelo sistema QUALAR em cetesb.. Nos Estados Unidos, a EPA mantém um portal organizado de dados abertos em epa.gov/outdoor-air-quality-data.

Caso utilize outra base, será necessário adaptar o pré-processamento feito na aula, já que o Prophet exige um formato específico. No curso, convertemos a coluna Data para datetime com pd.to_datetime(df['Data']). Em uma nova base, verifique se a coluna de data está no formato correto, trate valores ausentes e renomeie as colunas para o padrão exigido pelo Prophet, sendo ds para datas e y para a variável prevista.

Minha sugestão é desenvolver a primeira versão com a base do curso para garantir que todo o pipeline funcione corretamente. Depois, você pode criar uma versão 2.0 utilizando uma base externa e comparar os resultados.

Bons estudos e continue explorando.

Bons estudos!

Sucesso

Imagem da comunidade

minha é se isso não atrapalharia eu postar no meu portfólio esse do curso?

Olá, William! Tudo bem?

Não atrapalha de forma alguma! Pelo contrário, é muito válido e recomendado postar.

Colocar o projeto do curso no seu portfólio mostra para as empresas e recrutadores que você está estudando ativamente, que tem a disciplina para concluir capacitações e, principalmente, que compreende a base técnica da ferramenta (neste caso, a modelagem de séries temporais com o Prophet).

Como muitos alunos fazem os mesmos cursos, o segredo para o seu projeto não ser "só mais um" igual aos outros é caprichar na documentação (o famoso README do repositório). Para se destacar com o projeto da aula.

E conectando com a nossa conversa anterior: você posta esse projeto do curso agora (como sua base de aprendizado) e, futuramente, quando aplicar a mesma lógica em uma base totalmente nova (como do Kaggle ou da CETESB), você lança um segundo projeto. Ter os dois no seu portfólio vai mostrar aos recrutadores a sua capacidade de sair do ambiente controlado do curso para o mundo real!

Pode postar sem medo.

Bons estudos!