Solucionado (ver solução)
Solucionado
(ver solução)
2
respostas

Dúvida sobre os dados de recomendação

Observei que o dataset que utilizamos ao longo do curso utiliza notas de 0 a 5 num passo de 0.5 entre elas, algo semelhante a o que a Netflix fazia alguns anos atrás, mas hoje eles alteraram para "gostei" e "não gostei".

Minha dúvida é: Isso tem uma influência grande na hora de criar uma classificação? Quais as vantagens e desvantagens de cada um?

Desde já agradeço :)

2 respostas
solução!

Leonardo, tudo bom?

De forma geral, temos aqui uma característica de valores possíveis no nosso universo que vão influenciar o modelo. Vamos pensar.

Qual a diferença de um filme que recebeu 3.5 para um que recebeu 4.0? Difícil dizer se essa diferença de nota é realmente algo significativo (temos ai um cinéfilo avaliando) ou apenas um chute de usuário. Ao passo que o "gostei" ou "não gostei" traz mais relevância para esse tipo de análise.

Veja que esse não seria o raciocínio se estivéssemos analisando notas de alunos do ensino médio do país. Nesse caso, as variações 0.5 fazem sentido.

Muito obrigado, Ronald!

Agora ficou mais clara essa diferença, e quando faz sentido usar cada um :)

Quer mergulhar em tecnologia e aprendizagem?

Receba a newsletter que o nosso CEO escreve pessoalmente, com insights do mercado de trabalho, ciência e desenvolvimento de software