1
resposta

Motivo para a seleção do step "Join rows (cartesian product)"

Olá, gostaria de saber quais critérios foram usados para selecionar o step "Join rows (cartesian product)" para fazer a junção das duas fontes de dados ao invés do step "Merge join", que tem um funcionamento parecido. Ao fazer a junção de duas fontes, como escolho entre eles?

1 resposta

Oii Marcella, tudo bem?

O Join Rows, permite produzir combinações de todas as linhas nos fluxos de entrada, como no exemplo abaixo:

Imgur

A etapa Anos x Meses x Dias gera todas as combinações de Ano, Mês e Dia (por exemplo, 1900, 1, 1 2100, 12, 31) e pode ser usada para criar uma dimensão de data. E foi o que fizemos com a Região.

O Merge Join, se você tiver conhecimentos básicos de SQL vai perceber que o resultado deste componente é semelhante a um comando JOIN entre duas tabelas, porém no ETL ele faz a junção entre dois (e apenas dois) fluxos diferentes.

Espero ter ajudado. Qualquer dúvida estou à disposição, tá bom? :)

Quer mergulhar em tecnologia e aprendizagem?

Receba a newsletter que o nosso CEO escreve pessoalmente, com insights do mercado de trabalho, ciência e desenvolvimento de software