Engenharia de dados
Plano de Estudos Integrado para Engenharia de Dados + Machine Learning
- (Engenharia de Dados e Machine Learning), desenvolvi um plano integrado que equilibra ambas as áreas:*
��Fase 1: Fundamentos Sólidos
Programação Python Essencial
- Aprenda a programar em Python com Orientação a Objetos
- Boas práticas em Python
- Praticando Python
Matemática/Estatística Aplicada
- Estatística com Python
- Otimização com Python
Manipulação de Dados
- Python para Data Science
- Praticando Python para Data Science
- Avançando em Data Science com Python
��Fase 2: Engenharia de Dados Core
Big Data Processing
- Apache Spark com Python (prioridade #1)
- Engenharia de dados com Databricks
Orquestração e Pipelines
- Apache Airflow (prioridade #2)
- Fundamentos de Governança de Dados
- Primeiros passos com Engenharia de Dados
Cloud Engineering
- Certificação AWS Certified Cloud Practitioner
- Começando na AWS (EC2, S3, VPC, RDS)
- Infraestrutura como código
��Fase 3: Machine Learning Engineering
Fundamentos de ML
- Machine Learning: Regressão
- Machine Learning: Classificação
- Machine Learning na prática
ML Avançado e Produção
- Machine Learning Avançada
- CD4ML: Continuous Delivery for ML
- NLP com Python (se aplicável)
Deep Learning (opcional)
- Deep Learning com PyTorch/TensorFlow
- Visão Computacional (se necessário)
☁️Fase 4: Sistemas de ML em Produção
MLOps e Cloud Avançada
- AWS Data Lake: construindo pipelines
- AWS Observabilidade (CloudWatch, ECS, EKS)
- Integração Contínua e Entrega Contínua
- Aprofunde em AWS com serviços de gerenciamento
Certificação Final
- Certified Solutions Architect - Associate
☁️Abordagem Recomendada: Estudo em Paralelo: Após a Fase 2, estude Eng. Dados e ML simultaneamente
- Ex: Manhãs para Engenharia de Dados, Tardes para ML
Projetos Integrados: Desenvolva projetos que usem:
- Spark para processamento
- Airflow para orquestração
- AWS para infra
- Modelos ML como parte do pipeline
Ênfase em Produção: Foque em:
- Model deployment
- Monitoring
- Pipeline reliability
- Scalability
⚠️Pontos Críticos:
- Spark + Airflow: Essenciais para carreira dual
- CD4ML: Ponte entre as duas áreas
- AWS: Domine especialmente S3, Glue, SageMaker, EMR Não negligencie: Testes, versionamento, monitoramento
Planos de estudo são sequências de cursos e outros conteúdos criados por alunos e alunas da Alura para organizar seus estudos. Siga planos que te interessem ou crie o seu próprio.
Passo a passo
-
1
Conteúdo do plano
-
Formação A partir do zero: iniciante em programação
-
Formação Aprenda a programar em Python com Orientação a Objetos
-
Formação Boas práticas em Python
-
Formação Praticando Python
-
Formação Estatística com Python
-
Formação Python para Data Science
-
Formação Otimização com Python
-
Formação Praticando Python para Data Science
-
Formação Avançando em Data Science com Python
-
Formação Apache Spark com Python
-
Formação Engenharia de dados com Databricks
-
Formação Apache Airflow
-
Formação Fundamentos de Governança de Dados
-
Formação Primeiros passos com Engenharia de Dados
-
Formação Certificação AWS Certified Cloud Practitioner
-
Formação Começando na AWS com Lightsail, EC2, S3, VPC, RDS e DynamoDB
-
Formação Infraestrutura como código
-
Formação Machine Learning com Python: Regressão
-
Formação Machine Learning com Python: Classificação
-
Formação Machine Learning na prática: fundamentos e aplicações
-
Formação Machine Learning Avançada
-
Formação Machine Learning para Negócios Digitais
-
Formação CD4ML: Continuous Delivery for Machine Learning
-
Formação NLP com Python
-
Formação Deep Learning com Pytorch
-
Formação Visão Computacional com OpenCV
-
Formação AWS Data Lake: construindo pipelines na AWS
-
Formação AWS: Observabilidade com CloudWatch e Containers com ECS e EKS
-
Formação Integração Contínua e Entrega Contínua
-
Formação Aprofunde em AWS com serviços de gerenciamento e operação
-
Formação Certificação Certified Solutions Architect - Associate
-
Alura+ O que é uma API?
-
Alura+ O que é REST?
-
Artigo REST: Conceito e fundamentos
-
Formação IA aumentada: otimização e tomada de decisões
-
Formação Deep Learning com Tensorflow Keras
-
Artigo Carreira em dados: quais as habilidades necessárias e como está o mercado de trabalho
-