7 Days Of Code - Ciência de Dados
7DaysOfCodeDados
🪧 Vitrine.Dev | |
---|---|
✨ Nome | 7 Days Of Code - Ciência de Dados |
🏷️ Tecnologias | python |
🚀 URL | |
🔥 Desafio | 7 Days Of Code |
Sobre o desafio 📚
Desafios propostos no 7 Days Of Code sobre ciência de dados.
Minha prática 👩🏻💻
Desafio 1/7: Data Cleaning and Preparation
Baixar um dataset do portal do CEAPS (Cota para Exercício da Atividade Parlamentar dos Senadores) e aplicar processos de tratamento e limpeza de dados.
Ao final do tratamento dos dados, gerei uma amostra do dataset final, com registros referentes de 2018 a 2022.
Desafio 2/7: Data Visualization & Storytelling
Investigar os dados e gerar visualizações para identificar padrões estranhos ou estatísticas interessantes.
Entre os padrões estranhos, haviam registros de 2002 cadastrados em 2022 e também de datas posteriores à última atualização do CEAPS.
Desafio 3/7: Forecasting
Utilizar técnicas de Machine Learning e ferramentas estatísticas para prever o futuro.
Neste caso, criar um modelo que irá prever quanto os senadores vão gastar nos próximos três meses.
Para fazer este desafio, utilizei o dataset disponibilizado, que é composto por duas colunas: ‘ds’ (datas) e ‘y’ (valor acumulado daquele dia). As datas vão do dia 01/01/2018 até 31/12/2022, acumulando o total de 1461 registros. Para solucionar este desafio, foi apresentada duas opções:
- usar o Prophet, do Facebook;
- ou usar a Regressão Linear, do Scikit Learning.
Com o Prophet, o resultado foi o seguinte:
Desafio 4/7: Sistemas de recomendação
A proposta deste desafio é simples e atual, pois, diante os diversos streams no mercado, devo desenvolver um código que recomende 5 filmes de acordo com o histórico de consumo/avaliação de um usuário, a partir do banco de dados da MovieLens.
Fiz o upload do notebook aqui, mas ele também está disponível no Kaggle.
Ao final, consegui as seguintes recomendações para um novo usuário:
Desafio 5/7: Servindo modelos em API
Criar uma API que irá consumir o modelo de recomendação de filmes, desenvolvido no último desafio, e receber requisições.
Desafio 6/7: Teste A/B e Testes de Hipótese
Partindo para um outro contexto, neste desafio eu tive que analisar o resultado de um teste A/B de uma página. Verificando se houve maior conversão dos clientes que tiveram acesso à nova página, ou não, ao realizar um teste de hipótese.
A proposta do teste é simples: Verificar se a mudança na página provocou maior conversão de clientes. Em que considerei que:
- Hipótese nula = a conversão de clientes é igual nas duas páginas (p-valor > 0.05)
- Hipótese alternativa = uma das páginas teve um melhor desempenho (p-valor < 0.05)
O retorno da função mostrou que a página nova não apresentou maior conversão do que a versão antiga.
O teste completo também está disponível nesta página no Kaggle.
Desafio 7/7: Documente e crie seu portfólio
E para concluir os desafios, o último é para compartilhar o que desenvolvi nos dias anteriores.