Plano de Estudo

Engenharia de dados

189 cursos
2 posts

Plano de Estudos Integrado para Engenharia de Dados + Machine Learning

  • (Engenharia de Dados e Machine Learning), desenvolvi um plano integrado que equilibra ambas as áreas:*

��Fase 1: Fundamentos Sólidos

Programação Python Essencial

  • Aprenda a programar em Python com Orientação a Objetos
  • Boas práticas em Python
  • Praticando Python

Matemática/Estatística Aplicada

  • Estatística com Python
  • Otimização com Python

Manipulação de Dados

  • Python para Data Science
  • Praticando Python para Data Science
  • Avançando em Data Science com Python

��Fase 2: Engenharia de Dados Core

Big Data Processing

  • Apache Spark com Python (prioridade #1)
  • Engenharia de dados com Databricks

Orquestração e Pipelines

  • Apache Airflow (prioridade #2)
  • Fundamentos de Governança de Dados
  • Primeiros passos com Engenharia de Dados

Cloud Engineering

  • Certificação AWS Certified Cloud Practitioner
  • Começando na AWS (EC2, S3, VPC, RDS)
  • Infraestrutura como código

��Fase 3: Machine Learning Engineering

Fundamentos de ML

  • Machine Learning: Regressão
  • Machine Learning: Classificação
  • Machine Learning na prática

ML Avançado e Produção

  • Machine Learning Avançada
  • CD4ML: Continuous Delivery for ML
  • NLP com Python (se aplicável)

Deep Learning (opcional)

  • Deep Learning com PyTorch/TensorFlow
  • Visão Computacional (se necessário)

☁️Fase 4: Sistemas de ML em Produção

MLOps e Cloud Avançada

  • AWS Data Lake: construindo pipelines
  • AWS Observabilidade (CloudWatch, ECS, EKS)
  • Integração Contínua e Entrega Contínua
  • Aprofunde em AWS com serviços de gerenciamento

Certificação Final

  • Certified Solutions Architect - Associate

☁️Abordagem Recomendada: Estudo em Paralelo: Após a Fase 2, estude Eng. Dados e ML simultaneamente

  • Ex: Manhãs para Engenharia de Dados, Tardes para ML

Projetos Integrados: Desenvolva projetos que usem:

  • Spark para processamento
  • Airflow para orquestração
  • AWS para infra
  • Modelos ML como parte do pipeline

Ênfase em Produção: Foque em:

  • Model deployment
  • Monitoring
  • Pipeline reliability
  • Scalability

⚠️Pontos Críticos:

  • Spark + Airflow: Essenciais para carreira dual
  • CD4ML: Ponte entre as duas áreas
  • AWS: Domine especialmente S3, Glue, SageMaker, EMR Não negligencie: Testes, versionamento, monitoramento

17.2k xp

Última atualização em

14/04/2025

O que é este plano de estudo?

Planos de estudo são sequências de cursos e outros conteúdos criados por alunos e alunas da Alura para organizar seus estudos. Siga planos que te interessem ou crie o seu próprio.

Passo a passo

  1. 1

    Conteúdo do plano