1
resposta

[Reclamação] Sampling diferente

Gostaria apenas de salientar para os que acessarem esse forum, que o sampling de chuvas não possui o mes de fevereiro para alguns alunos, resultando em um empilhamento e agrupamento diferente para cada um!!

1 resposta

Olá, Rafael! Entendo sua preocupação e agradeço por compartilhar essa informação com a comunidade.

A questão que você mencionou sobre a diferença nos dados de amostra (sampling) para o mês de fevereiro pode realmente causar diferenças nos resultados do agrupamento e empilhamento dos dados. Isso ocorre porque o Apache Beam, a ferramenta que estamos usando neste curso, processa os dados com base nas informações fornecidas. Se os dados de entrada são diferentes para diferentes alunos, os resultados também serão diferentes.

No entanto, é importante lembrar que o objetivo principal desta atividade é aprender a usar o Apache Beam para criar pipelines de dados, e não necessariamente obter os mesmos resultados. Na prática, ao lidar com conjuntos de dados do mundo real, é comum que os dados sejam diferentes e que os resultados variem.

Ainda assim, entendo que ter um conjunto de dados consistente pode facilitar o aprendizado, especialmente quando estamos começando. Portanto, sua observação é muito válida e apreciada.

Espero ter ajudado e bons estudos!