1
resposta

[Dúvida] Duplicar realmente é a única e melhor opção?

Estou criando um projeto com as aulas que fiz aqui na Alura, porém me deparei com um problema.
Conforme crio as dimensões apartir de cópias da fato, o Power Query vai ficando muito mais lento que o normal, acredito que visando desempenho talvez essa não seja a melhor opção, realmente é a única maneira ou tem alguma outra?

1 resposta

Olá, Lucas, tudo bem?!

Que legal que você está atento à performance do seu projeto! Você tem razão: duplicar a tabela fato repetidamente pode, sim, deixar o Power Query mais lento. Isso acontece porque, ao duplicar, o Power BI cria uma cópia independente que "refaz" todos os passos de extração e transformação da tabela original para cada nova dimensão criada.

Abaixo deixo alternativas a duplicação:

  • Use "Referenciar" em vez de "Duplicar": Em vez de criar uma cópia isolada, clique com o botão direito na sua tabela fato e escolha Referenciar.

    Como funciona a Referência: Diferente da duplicação, a referência utiliza o resultado final da sua tabela fato como ponto de partida. Assim, evita que o Power Query processe novamente a conexão com a fonte original para cada dimensão, economizando muita memória e tempo de processamento.

    Deixo uma atividade Para Saber Mais que explica a diferença:
    Para saber mais: diferença entre duplicar e referenciar uma tabela

    tabela de comparação entre duplicar e referenciar. Títulos de coluna e linhas estão em verde com fonte em cor cinza-escuro, demais células em cinza-escuro com fonte em cor branca. Existem 6 linhas comparando 6 aspectos, de cima para baixo são: definição, sincronização, dependência, armazenamento, etapas de tratamento e uso de referências. As características de duplicar são, de cima para baixo: copia o conjunto de dados existente; alterações não afetam o original; independente e modificável sem afetar o original; consome espaço adicional; todas as etapas são mantidas; pode referenciar a tabela nova na original. As características de referenciar são, de cima para baixo: aponta para conjunto de dados existente; alterações refletidas automaticamente; dependente do conjunto de dados referenciado; não consome espaço adicional; contém uma única etapa (obtenção da tabela original); não é suportado, pois pode gerar referência circular
  • Criação de Dimensões via DAX: Como mencionado na aula, dimensões como a de data (calendário) podem ser criadas diretamente via DAX, sem sobrecarregar o Power Query.

  • Desabilite a Carga da Tabela Original: Se você transformou sua tabela "grande" (OBT) em várias dimensões e em uma nova fato otimizada, lembre-se de clicar com o botão direito na tabela original e desmarcar "Habilitar Carga". Isso impede que o Power BI gaste recursos tentando carregar a tabela bruta desnecessariamente para o modelo final.

Espero que isso ajude a destravar o desempenho do seu projeto!

Qualquer dúvida que surgir, compartilhe no fórum. Abraços e bons estudos!

Caso este post tenha lhe ajudado, por favor, marcar como solucionado ✓. Bons Estudos!