Estou acostumado com ETL, mas não conheço o ELT e conceito de Data Lake. Eles não ficaram claros para mim na explicação do vídeo.
Você está vendo a versão anterior da nova experiência da Alura que estamos preparando para você. Em breve, ela ganha uma identidade visual novinha totalmente pensada em potencializar seus estudos!
Estou acostumado com ETL, mas não conheço o ELT e conceito de Data Lake. Eles não ficaram claros para mim na explicação do vídeo.
Ola, Fabio tudo bem ?
O Data Lake é um tipo de repositório de dados onde você pode armazenar grandes volumes de dados de forma bruta, sem precisar estruturá-los antes de armazená-los. Ou seja, você pode armazenar qualquer tipo de dado (estruturado, semiestruturado ou não estruturado) sem a necessidade de um esquema definido, o que facilita a coleta de dados em larga escala.
Enquanto no ETL (Extract, Transform, Load), os dados são extraídos, transformados para o formato desejado e, só depois, carregados no banco de dados, no ELT (Extract, Load, Transform), os dados são extraídos e carregados no repositório primeiro e, só então, são transformados dentro do próprio Data Lake. Isso permite mais flexibilidade, já que a transformação ocorre quando os dados são acessados, não durante o processo de carregamento.
Paulo, quando a gente carrega dados numa tabela "stage" ela então é considerada um data lake?