Estou no ponto: Pergunta: Crie 2 boxplots no mesmo plot comparando a coluna total_de_votos dos filmes de categoria Horror e Adventure Até ai tudo bem, achei de resolveria com o codigo:
import matplotlib.pyplot as plt
genero_horror = filmes[filmes['Horror'] == 1]
genero_adventure = filmes[filmes['Adventure'] == 1]
plt.boxplot([genero_horror.total_de_votos, genero_adventure.total_de_votos], labels= ['Horror', 'Adventure'])
Mas ele não gera o boxplot, só a grade. Investigando, descobri que existem NaN na coluna total_de_votos, que apareceram quando eu inclui a coluna:
nota_media = notas.groupby('filmeId').mean().nota
filmes['nota_media'] = nota_media.astype(float)
No final não consegui gerar o boxplot, não sei se inclui a coluna de maneira errada e gerou os Nan, não sei nem se é esse o problema. Resumindo, gostaria de saber se tem algo errado nesses códigos. Se não tiver, posso simplesmente retirar esses NaNs e seguir minha vida?