3
respostas

Dúvida sobre Datalake

Temho uma dúvida, nesse curso e no curso anterior foi usado a abordagem do ELT certo? Mas, caso use o ETL é preciso fazera criacão do Datalake ou ja pode ir direto para o DW?

No meu caso é o seguinte, tenho essas duas tabelas abaixo que são tabelas de contratos de bancos diferentes. Essas tabelas ja existem em produção populada com dados. Eu criei esse modelo de DW, eu ja poderia puxar dados delas diretamente pro DW sem a necessidade de criar o datalake? Por que pelo que entendi o datalake seria para ter massa de dados e depois alimentar o DW, mas como ja tenho a massa de dados daria certo puxar pro DW?

Outra dúvida seria em como alimentar a tabela de fato e a de tempo diretamente no DW. Como seria? Vai ser mostrado nos próximos cursos?

. Insira aqui a descrição dessa imagem para ajudar na acessibilidade

3 respostas

Oii, Davi, tudo bem com você? :)

Vamos por partes para esclarecer suas dúvidas, assim fica mais tranquilo.

Caso use o ETL é preciso fazer a criação do Data Lake ou já pode ir direto para o DW?

Se você optar por usar a abordagem ETL (Extract, Transform, Load), onde os dados são transformados antes de serem carregados no DW, a criação de um Data Lake não é estritamente necessária.

O Data Lake é útil para armazenar grandes volumes de dados brutos que podem ser transformados posteriormente, mas se você já tem os dados prontos e transformados, pode carregá-los diretamente no DW. No seu caso, como as tabelas de contratos já estão populadas e você já possui um modelo de DW, você pode sim puxar os dados diretamente para o DW sem a necessidade de criar um Data Lake.


Alimentação das Tabelas de Fato e Dimensão

Para alimentar as tabelas de fato e dimensão diretamente no DW, você pode seguir os seguintes passos:

  • Extração dos Dados: extrair os dados das tabelas de contratos existentes.

  • Transformação dos Dados: realizar as transformações necessárias para que os dados estejam no formato adequado para as tabelas de dimensão e fato. Por exemplo, para a tabela dim_tempo, você pode gerar registros baseados nas datas dos contratos.

  • Carregamento dos Dados: carregue os dados transformados nas tabelas de dimensão (dim_contrato_crm, dim_contrato_gestor, dim_tempo). Após isso, você pode arregar os dados na tabela de fato (fato_contrato), garantindo que as chaves estrangeiras estejam corretamente mapeadas para as tabelas de dimensão.


Dúvida nos Próximos Cursos

Quanto à sua dúvida sobre se isso será mostrado nos próximos cursos, este curso vai te inteirar sobre a questão de alimentar a fato e tempo.

Abraços!

Caso este post tenha lhe ajudado, por favor, marcar como solucionado ✓.

Muito show, obrigado Isabel, você teria alguma trilha sobre power bi para após eu criar meu DW aprender a mexer com power bi? Grato.

Disponha, Davi!

Nós temos duas trilhas que podem te interessar:

  • Formação Power BI - nessa formação é apresentado o Power BI de maneira geral.

  • Formação Data Warehouse com Data Marts e Power BI - nessa formação é apresentado os Data Marts com o Power BI. Um Data Mart é basicamente uma seção menor do DW, em que é especificado uma unidade de negócios. Acredito que essa formação pode ser bem legal para o assunto que você está aprendendo :)

Se outra dúvida surgir, estamos aqui!

Abraços!

Caso este post tenha lhe ajudado, por favor, marcar como solucionado ✓.