[Dúvida] Projeto Real | Data Lake e Integration Services: construindo e carregando as dimensões

Olá, Igor.

Tudo bem?

Em um contexto empresarial real, o carregamento de dados em um Data Lake pode ocorrer de várias maneiras, dependendo das necessidades específicas da empresa e da natureza dos dados. Como você mencionou, muitas empresas atualizam seus dados continuamente e utilizam conexões diretas com bancos de dados, seja on-premise ou na nuvem.

Essa atualização contínua de dados é geralmente realizada por meio de processos automatizados conhecidos como ETL (Extract, Transform, Load). Esses processos podem ser codificados em várias linguagens de programação, dependendo das ferramentas e infraestrutura que a empresa está usando. PHP pode ser usado, mas outras linguagens como Python, Java, ou até mesmo ferramentas específicas de ETL como Apache NiFi, Apache Beam, Google Dataflow, entre outros, também são comumente usadas.

Quanto à sua pergunta sobre os cursos da Alura, sim, vou deixar esse curso que encontrei aqui na plataforama da Alua, ele aborda esses tópicos, o curso é esse "Data Lake e Integration Services: construindo e carregando as dimensões" aborda como criar um Data Lake e utilizar ferramentas.

Espero ter ajudado. Qualquer dúvida manda aqui. Bons estudos.

Garanta sua matrícula hoje e ganhe + 2 meses grátis