Solucionado (ver solução)
Solucionado
(ver solução)
2
respostas

NaN aparecendo do nada!

Estou no ponto: Pergunta: Crie 2 boxplots no mesmo plot comparando a coluna total_de_votos dos filmes de categoria Horror e Adventure Até ai tudo bem, achei de resolveria com o codigo:

import matplotlib.pyplot as plt

genero_horror = filmes[filmes['Horror'] == 1]
genero_adventure = filmes[filmes['Adventure'] == 1]

plt.boxplot([genero_horror.total_de_votos, genero_adventure.total_de_votos], labels= ['Horror', 'Adventure'])

Mas ele não gera o boxplot, só a grade. Investigando, descobri que existem NaN na coluna total_de_votos, que apareceram quando eu inclui a coluna:

nota_media = notas.groupby('filmeId').mean().nota
filmes['nota_media'] = nota_media.astype(float)

No final não consegui gerar o boxplot, não sei se inclui a coluna de maneira errada e gerou os Nan, não sei nem se é esse o problema. Resumindo, gostaria de saber se tem algo errado nesses códigos. Se não tiver, posso simplesmente retirar esses NaNs e seguir minha vida?

2 respostas
solução!

Depois de uma noite de sono e um tempo relaxando, descobri que os NaNs "apareceram" porque não tem nota para alguns filmes no dataset de notas. Vou simplesmente trocar eles por 0 e seguir a vida. Ainda não sei se minha solução para a questão dos boxplots está certa. Se tiver, eu posto e marco como resposta.

O código dos boxplots está correto, o problema eram os NaNs.

Quer mergulhar em tecnologia e aprendizagem?

Receba a newsletter que o nosso CEO escreve pessoalmente, com insights do mercado de trabalho, ciência e desenvolvimento de software