Challenge Data Science
challenge-data-science-2
🪧 Vitrine.Dev | |
---|---|
✨ Nome | Challenge Data Science |
🏷️ Tecnologias | mysql, python |
🚀 URL | https://github.com/fab-souza/challenge-data-science-2/ |
🔥 Desafio | Alura Challenges |
Sobre o Challenge 📚
A proposta do Challenge é simular o desenvolvimento de um projeto, que neste caso é fazer um estudo para reduzir o número de inadimplência no banco Alura Cash.
Minha prática 👩🏻💻
Semana 1:
O desafio da primeira semana é estudar o banco de dados da empresa, utilizando o MySQL, entendendo seus dados, verificando inconsistências, traduzir dados e exportar a tabela de dados, no formato csv.
As inconsistências que encontrei no banco de dados foram:
5 clientes com mais de 100 anos de idade;
2 clientes com 123 anos de trabalho;
e cliente com 42 anos de idade, 0 anos trabalhados e renda superior a 2 milhões por ano.
A forma que encontrei para exportar a tabela foi:
- chamar a tabela, selecionar a opção "Sem limite" de linhas e clicar em 'Export'.
Semana 2:
Os desafios da segunda semana consitiam em tratar os dados, ou seja, remover dados nulos e tratar os outliers. Além de analisar correlações, normalizar variáveis, criação de modelos de classificação e exportar o modelo.
Semana 3 e 4:
Analisando métricas: criando visualizações com o Power BI;
Criar uma API para disponibilizar o modelo no Power BI;
Conectar a API do modelo de Machine Learning no Power BI;
Criar parâmetros para receber os dados do cliente;
Analisar os dados através de gráficos;
Estilizar o dashboard.