Solucionado (ver solução)
Solucionado
(ver solução)
2
respostas

[Dúvida] Problemas de performance com SCD tipo 2 no Pentaho

Boa noite pessoal,

Tenho uma dimensão com aproximadamente 150 mil linhas de clientes em um projeto de DW, para essa dimensão por premissa do projeto tenho que manter o histórico de mudança de cidades e revendas, utilizei o step do pentaho: Dimension lookup/update porém tanto na carga e atualização da dimensão quanto da fato a velocidade de linhas por segundo cai absurdamente de +/- 6 mil r/s para 25 r/s e levando mais de duas horas para a primeira carga de uma fato com +/- 220 mil linhas Não tenho muita experiencia com esse step, alguém saberia informar se realmente ele é tão lento assim? e caso não seja existe alguma dica para identificar onde está o gargalo?

2 respostas
solução!

Oii, Cláudio!

O step Dimension Lookup/Update é conhecido por ser um pouco mais lento, devido à complexidade das operações que realiza, especialmente em um cenário de Slowly Changing Dimensions tipo 2, onde o histórico de mudanças é mantido.

No entanto, existem algumas estratégias que você pode tentar para melhorar a performance:

  • Ajuste o cache: o step Dimension Lookup/Update tem uma opção para definir o tamanho do cache. Aumentar o tamanho do cache pode ajudar a melhorar a performance, mas cuidado para não exceder a memória disponível.

  • Transformações em paralelo: se possível, por favor, tente dividir a sua transformação em várias transformações menores que podem ser executadas em paralelo. Isso pode ajudar a distribuir a carga de trabalho e acelerar o processo.

  • Revisão do design: às vezes uma revisão no design da transformação pode levar a melhorias de performance. Por exemplo, se você está usando muitos steps de lookup, talvez substituir por um único step de lookup mais complexo seja ideal.

A performance pode ser afetada por muitos outros fatores, como a configuração do seu sistema e a natureza dos seus dados. É importante lembrar que outras coisas podem ser o gargalo também.

Se outra dúvida surgir, estamos aqui.

Abraços!

Olá obrigado pela atenção, resolvi o problema ajustando o cache