Road to Hero (Yes, that's the name... don't you dare say anything...)
Plano de Estudos para Habilidades Essenciais em Data Science
O plano foi baseado no seguinte trecho encontrado no curso de Fundamentos de IA da IBM:
"Os cientistas de dados usam aprendizado de máquina e análise preditiva para obter insights de grandes quantidades de dados. Para se preparar, você deve construir seu conhecimento em ferramentas e plataformas de big data, talvez incluindo Hadoop, Pig, Hive, Spark e MapReduce. Seria útil se você fosse fluente em pelo menos duas linguagem de programação, incluindo Linguagem de Consulta Estruturada (SQL), Python, Scala e Perl. Você também deveria investir algum tempo em estatísticas inferenciais e descritivas de aprendizado."
Ele incluí:
- Structured Query Language
- Uma ferramenta de Big Data (Spark)
- Machine Learning Avançado
- Deep Learning
- Ferramentas de Visualização (Tableau e Power BI)
É importante também estudar o básico da matemática para ciência de dados:
- Probabilidade: Bayes, MLE, Distribuições Comuns
- Álgebra Linear: Escalares, Vetores, Matrizes, Tensores, Autovalores & Autovetores, Decomposição em Valores Singulares e PCA
- Cálculos: Derivadas, Cálculo de Vetor e Matriz, Algoritmos de Gradientes...
- Conhecimentos em TI: Entropia, Entropia-Cruzada, Kullback Leibler, Viterbi, Encoder-Decoder