Estou acostumado com ETL, mas não conheço o ELT e conceito de Data Lake. Eles não ficaram claros para mim na explicação do vídeo.
Estou acostumado com ETL, mas não conheço o ELT e conceito de Data Lake. Eles não ficaram claros para mim na explicação do vídeo.
Ola, Fabio tudo bem ?
O Data Lake é um tipo de repositório de dados onde você pode armazenar grandes volumes de dados de forma bruta, sem precisar estruturá-los antes de armazená-los. Ou seja, você pode armazenar qualquer tipo de dado (estruturado, semiestruturado ou não estruturado) sem a necessidade de um esquema definido, o que facilita a coleta de dados em larga escala.
Enquanto no ETL (Extract, Transform, Load), os dados são extraídos, transformados para o formato desejado e, só depois, carregados no banco de dados, no ELT (Extract, Load, Transform), os dados são extraídos e carregados no repositório primeiro e, só então, são transformados dentro do próprio Data Lake. Isso permite mais flexibilidade, já que a transformação ocorre quando os dados são acessados, não durante o processo de carregamento.
Paulo, quando a gente carrega dados numa tabela "stage" ela então é considerada um data lake?