1
resposta

Conceito de correlação e escolha da chuva

Não pude deixar de notar que as variáveis escolhidas para a análise foram temp_max, chuva e fds. Muitos dos meus professores de estatística dizem que um índice de correlação abaixo de |0,5| indica que há uma baixa correlação entre as variáveis e não devem servir pra explicar o modelo.

Claro que ao decorrer do curso essa escolha deve ser justificada, mas gostaria de entender, na visão do professor, como uma variável como uma correlação tão baixa pode ajudar a explicar o modelo.

Obrigado!

1 resposta

Olá Rafael, tudo bem? Espero que sim!

Desculpe pela demora em retornar.

No momento de selecionar as variáveis para o modelo, apenas foram descartadas as variáveis temp_media e temp_min, uma vez que têm uma alta correlação com a temp_max. Isso significa que elas têm um comportamento muito próximo para explicar o consumo de cerveja (variável target).

Essa redução de dimensionalidade das variáveis é uma técnica muito utilizada.

A PCA é uma técnica de redução de dimensionalidade que segue essa ideia: PCA

Bons estudos!