Solucionado (ver solução)
Solucionado
(ver solução)
5
respostas

Dúvidas Execução

Pessoal, boa tarde.

Estou finalizando o projeto mas algo me diz que uma correlação não está fazendo sentido. Quando é solicitado para interpretar a correlação entre nota_media e ano_de_lancamento, o valor da correlação foi de -0,15. O valor é baixo mesmo?

O código executado é bem simples:

filmes_correlacao = filmes[['ano_de_lancamento', 'nota_media']] filmes_correlacao.corr()

Estou desconfiado de ter algo errado, pois depois me solicitam qual o 'problema' pode ter gerado a correlação. Porém como o valor é muito baixo, achei estranho.

Alguém pode pelo menos me dar uma pista se esse é o valor esperado?

5 respostas

Será que alguém pode me ajudar? Estou com esse receio antes de submeter o projeto e até agora ninguém me respondeu.

Submeti meu projeto. Gostaria pelo menos de após a correção, alguém pudesse responder algumas dúvidas que acabaram surgindo. Sei que não é fácil responder tudo no fórum, mas pelo histórico das perguntas do projeto de DataScience, ninguém foi respondido. Achei o curso excelente até aqui, no entanto essa ausência de resposta me deixa extremamente frustrado.

solução!

Olá André,

Primeiro, desculpas pelo por demorar um tempinho para te responder!

Sua pergunta foi extremamente pertinente. A correlação é realmente baixa, porém o que deve realmente ser questionado é. Por que o ano de lançamento tem uma correlação com o ano de lançamento (mesmo que seja baixo)?. Se você refletir um pouco ano de lançamento não deveria ter relação nem uma a nota, assim a correlação deveria ser 0. Mesmo que a correlação seja pequena ela causa uma quebra de expectativa, então vale se refletir sobre o ponto.

P.S: Sua resposta está correta!

Att

Entendi. Mas acredito que a própria aleatoriedade dos dados não me permitiria encontra uma correlação exatamente igual a 0.

Existe um capítulo do livro The Signal and The Noise que fala sobre isso. Até 1997 , o ano em que um time da NFL ganhava o SuperBowl, o mercado de ações subia. Enquanto isso, o mercado caía todo ano em que um time da AFL ganhava. Era uma correlação quase que perfeita. No entanto, foi pura coincidência. Tanto que depois de 1998, essa correlação entre SuperBowl e Mercado de Ações performou extremamente mal. Na minha visão a aleatoriedade pode até demonstrar uma forte correlação em alguns casos, mas isso não quer dizer que exista causalidade.

Obrigado pela atenção.

Exatamente André,

É exatamente essa conclusão, como não a causalidade entre nota e ano de lançamento, pode se esperar ausência de correlação. Mas não é exatamente assim que as coisas funcionam no mundo da aleatóriedade!

Parabéns você está mandando muito bem nas análises.