Plano de Estudo
Engenharia de Dados Completo
86 cursos
Olá. Caso tenha chegado nesse plano de estudos por acaso, eu queria te dar a notícia de que o título está bem enganoso.
A primeira versão do plano tinha mais de 110 cursos. Achei que isso pudesse assustar algumas pessoas e também ficou difícil de gerenciar a ordem dos cursos.
Essa versão de agora é uma versão suficientemente completa, ou seja, pessoas que comecem essa linha e sigam até o final, vão ter um pouco mais do que o necessário para poder realizar o trabalho básico de um engenheiro de dados na maior parte do tempo.
Aqui envolve:
- uma linguagem para processamento, completa: Python.
- uma linguagem de consulta e seus conceitos: SQL.
- o basico de conceito ao redor disso.
- os principais tipos de estruturas e processamentos para poder ter autonomia na hora de executar o trabalho no dia a dia.
- Conceitos de Cloud para engenheiros de dados, utilizando Azure e GCP. A ideia é que a pessoa possa entender a ideia de ter dados em uma e fazer um data warehouse em outra. é um conceito legal. AWS ficou de fora apesar de ser bem utilizada. Mas com ela o plano tinha ficado enorme.
- Pentaho e Power BI tambem ficaram de fora, por questão de escolha pessoal. Se tiver afim, manda brasa. Não tenho nada contra o Power BI, mas com o Pentaho eu te sugiro não depender dele. Tudo que você faz com ele você consegue com programação de verdade.
- Tem no meio do plano conceitos de outras áreas, porque são áreas que conversam com eng. de dados. Está no plano, mas não é para aprender a fazer o trabalho deles. Só mesmo entender o que eles fazem para poder trabalhar melhor junto.
- Tem algumas coisas de DevOps também. O nível de aprofundamento em cada ferramenta e conceito vai depender de onde trabalhar. Se trabalhar onde tem alguém que faz isso para você, passa rapidinho pelos conceitos. Se não, essa responsabilidade é sua. Cuida do CI/CD, IaC e etc. Nesse caso, é bom dar uma olhadinha mais aprofundada em controle de acesso e segurança.
- Alguns cursos da lista é para passar voando. Outros é para assistir com muita calma, anotar e até repetir. quando eu tiver com mais paciência eu volto discriminando isso direitinho.
- Quase tudo no plano tem uma escala razoável de dificuldade. Começa do mais simples e vai até a um pouco menos simples. Quase nada é muito complexo. Com exceção das pipelines com Apache Beam em Python. Se você ainda não sabe Apache Beam, você não está preparado para aprender Apache Beam, porque não tem nada que te prepara. Não tem escala de dificuldade. Ele é uma trauletada de dificuldade porque tem um paradigma de programação meio diferente, que considera um pipeline predefinida antes do tempo de execução e collections carregadas na memória. Essas collections andam pela pipeline e são imutáveis. O fluxo dessa pipeline deve ser descrito através dos pTransforms padrão ou customizados, que podem rodar em um cluster com diferentes maquinas e fazer um processamento gigantesco de dados em curto espaço de tempo. Enfim, trabalhar com big data ainda não é facil, mas aqui não é lugar para explicar essas coisas. Mas se você se esforçar para valer, uma hora acaba aprendendo. pelo menos foi assim comigo.
Criado por
Guilherme Augusto Duque E Silva Costa
O que é este plano de estudo?
Planos de estudo são sequências de cursos e outros conteúdos criados por alunos e alunas da Alura para organizar seus estudos. Siga planos que te interessem ou crie o seu próprio.
Passo a passo
-
1
Conteúdo do plano
-
Curso JavaScript e HTML: desenvolva um jogo e pratique lógica de programação
-
Curso JavaScript e HTML: pratique lógica com desenhos, animações e um jogo
-
Curso Arquitetura de computadores: por trás de como seu programa funciona
-
Curso Linux I: conhecendo e utilizando o terminal
-
Curso Windows Prompt: Trabalhando na linha de comando
-
Curso HTTP: Entendendo a web por baixo dos panos
-
Curso Git e Github: controle e compartilhe seu código
-
Curso Git: Controle e compartilhe seu código
-
Curso Python: começando com a linguagem
-
Curso Python: avançando na linguagem
-
Curso Python: Manipulação de Strings
-
Curso Python Collections parte 1: listas e tuplas
-
Curso Python Collections parte 2: conjuntos e dicionários
-
Curso Python 3: entendendo o Tratamento de Erros
-
Curso Python: entendendo a Orientação a Objetos
-
Curso Python: avançando na orientação a objetos
-
Curso Python: trabalhando com I/O
-
Curso Expressões regulares: capturando textos de forma mágica
-
Curso Python Brasil: validação de dados no padrão nacional
-
Curso Testes automatizados: TDD com Python
-
Curso Testes em Python: trabalhando com dublês de testes
-
Curso Python: boas práticas de código com PEP8
-
Curso Design Patterns Python I: boas práticas de programação
-
Curso Design Patterns Python II: boas práticas de programação
-
Curso Modelagem de banco de dados relacional: entidades, relacionamentos e atributos
-
Curso Modelagem de banco de dados relacional: modelo e Álgebra Relacional
-
Curso Modelagem de banco de dados relacional: diagrama ER e Modelo Relacional
-
Curso Modelagem de banco de dados relacional: normalização
-
Curso Modelagem de banco de dados relacional: entendendo SQL
-
Curso Modelagem de banco de dados: NoSQL
-
Curso SQL com MySQL: manipule e consulte dados
-
Curso Consultas SQL: avançando no SQL com MySQL
-
Curso BigQuery: o banco de dados da Google para Big Data
-
Curso Google Cloud Storage: armazenamento de objetos na Google Cloud
-
Curso Google Cloud Functions: código Serverless
-
Curso Google Cloud Serverless: crie aplicações robustas e escaláveis
-
Curso Azure Functions: rodando código sem servidor
-
Curso Aplicações Serverless: construindo uma API REST
-
Curso Azure Armazenamento: trabalhando com File e Blob
-
Curso Python para Data Science
-
Curso Python para Data Science: linguagem e Numpy
-
Curso Python para Data Science: Funções, Pacotes e Pandas
-
Curso Git e Github: estratégias de ramificação, Conflitos e Pull Requests
-
Curso Business Intelligence: trabalhando com Data Warehouse
-
Curso Python Pandas: tratando e analisando dados
-
Curso Pandas: formatos diferentes de entrada e saída (IO)
-
Curso Python Pandas: técnicas avançadas
-
Curso HTML5 e CSS3 I: Suas primeiras páginas da Web
-
Curso String em Python: extraindo informações de uma URL
-
Curso Scraping com Python: coleta de dados na web
-
Curso Linux II: programas, processos e pacotes
-
Curso Data Science: analise e visualização de dados
-
Curso ETL com Integration Services: modelo de dados
-
Curso ETL com Integration Services: transformação de dados
-
Curso Data Visualization: explorando com Seaborn
-
Curso Spark: Começando com manipulação de dados
-
Curso MLOps: Machine Learning e APIs
-
Curso MLOps: deploy de modelos
-
Curso Google Data Studio: explorando ferramenta
-
Curso Redes parte 1: conceitos e prática
-
Curso Swagger parte 1: Crie uma documentação APIs REST
-
Curso Docker: Criando containers sem dor de cabeça
-
Curso Gitlab CI e Docker: Pipeline de entrega contínua
-
Curso Terraform: automatize a infraestrutura na nuvem
-
Curso C# parte 1: primeiros passos
-
Curso JavaScript: explorando a linguagem
-
Curso Apache Beam: Data Pipeline com Python
-
Curso Dashboard com Tableau: Visualize e analise os seus dados
-
Curso Data Analytics: Machine Learning com Google Cloud Platform
-
Curso Desenvolvimento de carreira: a demanda do mercado
-
Curso Desenvolvimento de carreira: como alcançar a posição desejada
-
Curso Agilidade: promovendo a transformação ágil
-
Curso Google Kubernetes Engine
-
Curso Google Kubernetes Engine: avançando com GKE
-
Curso Kubernetes: Pods, Services e ConfigMaps
-
Curso Kubernetes: Deployments, Volumes e Escalabilidade
-
Curso Associate Cloud Engineer parte 1: a certificação do Google Cloud
-
Curso Associate Cloud Engineer parte 2: a certificação do Google Cloud
-
Curso Associate Cloud Engineer parte 3: a certificação do Google Cloud
-
Curso Associate Cloud Engineer parte 4: A certificação do Google Cloud
-
Curso Google Associate Cloud Engineer: simulado comentado
-
Curso Google Cloud Endpoints: integrando a API
-
Curso Google Cloud Compute Engine: escalabilidade e alta disponibilidade
-
Curso BigQuery: manipulação de dados
-
Curso Cloud Onboarding: conhecendo os principais provedores parte 2
-
Curso Cloud Onboarding: trabalhando com os principais provedores
-