1
resposta

Add Retas de Referencia no CDF

Para facilitar a interpretação e mesmo o uso do CDF apresentado no curso de Introdução a Testes Estatísticos, adicionei em paralelo aos eixo do gráfico as retas de referencia das medias de filmes conforme código abaixo. Acho que isso enriquece o gráfico e auxilia no seu uso pratico.

filmes_abaixo_da_media = np.count_nonzero(nota_media_dos_filmes_com_pelo_menos_10_votos.values <= nota_media_dos_filmes_com_pelo_menos_10_votos.mean())
media_no_acumulado = filmes_abaixo_da_media / nota_media_dos_filmes_com_pelo_menos_10_votos.count()

ax = sns.distplot(nota_media_dos_filmes_com_pelo_menos_10_votos.values, 
                  hist_kws={'cumulative':True}, 
                  kde_kws={'cumulative':True})
ax.set_xlabel('Nota Media')
ax.set_ylabel('% Acumulado de Filmes')
ax.set_title('Media de Votos no Movielens 100k com pelo menos 10 votos')
ax.axvline(x=nota_media_dos_filmes_com_pelo_menos_10_votos.mean(), ymin=0, ymax=1)
ax.axhline(y=media_no_acumulado)
1 resposta

Olá Raphael, tudo bem? Espero que sim!

Desculpe pela demora em retornar.

Muito bom compartilhar aqui no fórum para todos Raphael. Foi uma boa ideia adicionar ao gráfico novas informações que ajudam na análise.

Bons estudos!

Quer mergulhar em tecnologia e aprendizagem?

Receba a newsletter que o nosso CEO escreve pessoalmente, com insights do mercado de trabalho, ciência e desenvolvimento de software