Roadmap Data Science
1) Entender o problema
Se reunir com os especialistas que tem dominio sobre o assunto que envolve o problema, com o intuito de discutir e eleborar um plano para a solução do problema. Essa etapa é crucial para descobrir quais variáveis serão uteis para a resolução do problema.
Habilidades
- Saber se comunicar e expressar-se bem
- Perspicácia nos negócios: trabalhe para fazer as perguntas certas para responder, aquelas que realmente visam resolver o problema
- Conseguir propor novas análises, experimentos, estudos e processos de trabalhos
- Trabalhar seguindo uma lógica para no final entregar relatórios objetivos
- Trabalhar em equipe
- Ser proativo
- Ser aberto a desafios
2) Obter e preparar os dados
Obter os dados de diferentes fontes e formatos e prepara-los (descobrir inconsistências e outliers visando maximizar a obtenção de informações ocultas em sua estrutura) para uma melhor eficiência na hora da analise. Essa é uma etapa critica de todo o processo, pois a qualidade da analise vai depender da qualidade dos dados.
Habilidades
- Python para Data Science
- Ferramentas de trabalho básicas
- Pip e Venv
- Jupyter
- Manipulação de dados
- Pandas
- Numpy
- Saber lidar com vários tipos de data set
- CSV
- Excel
- Banco de dados
- SQL e MySQL
- Hadoop e Apache Spark
3) Explorar os dados
Utilizar tecnicas variadas para analizar os dados com o intuito de descobrir relações entre os dados, padrões, tendências e resumir suas principais caracteristicas antes que eles sejam submetidos a alguma aplicação, seja ela de négocios, estatistica ou aprendizado de maquina.
Habilidades
- Matemática
- Estatística e probabilidade
- Calculo
- Álgebra linear
- Visualização de dados
- Matplotlib
- Seaborn
- Manipulação de dados (coloquei só para destacar que você vai usar essas habilidades aqui tbm)
- Pandas
- Numpy
4) Modelagem de dados
Escolher tecnicas de Machine learning (Machine learning é um ramo da inteligência artificial baseado na ideia de que sistemas podem aprender com dados, identificar padrões e tomar decisões com o mínimo de intervenção humana) para encontrar padrões e respostas para suas perguntas.
Habilidades
- Machine Learning
- Introdução a Machine learning
- Classificação
- Regressão
- Agrupamento de dados
- Avaliação do modelo de ML
- Será que seu modelo atinge todas as necessidades que foram definidas inicialmente?
- Visando o entedimento dos tomadores de decisão do negocio, saber escolher o melhor modelo de ML
- Deployment de modelos de ML
- O que será apresentado aqui pode ser um um software, um relatório, uma apresentação em ppt
5) Tomada de decisões
O cientista de dados deve se reunir com os especialistas e os tomadores de decição do négocio para mostrar os resultados de seu trabalho e discutirem qual é a melhor decisão a ser tomada.
Habilidades
- Saber se comunicar e expressar-se bem
- Desenvolver Dashboards
- BI e Data Studio