Não exatamente uma dúvida, só uma contribuição de alguém que (injustificavelmente) gosta de gráficos de pizza :P Para facilitar a leitura do gráfico de pizza que, como o instrutor aponta, é muito mais difícil de se estimar as diferenças de tamanho, uma solução bem simples e rápida seria adicionar os respectivos percentuais às labels.
total_por_lingua = (tmdb_m['original_language'].value_counts(normalize=True)*100) # normalize=True * 100 transforma o resultado, efetivamente, em um valor percentual
total_geral = (total_por_lingua.sum())
total_ingles = total_por_lingua['en'].round(2)
total_outros = (total_por_lingua.sum() - total_ingles).round(2) # .round(2) só porque acho números com muitas casas decimais feios haha
Depois, na formação do dataframe que usamos para plottar os gráficos na aula, basta adicionar os valores de total_ingles
e total_outros
como strings, usando a built in function str()
, nos seus respectivos valores da key 'lingua'
.
dados = {
'lingua':[('ingles (' + str(total_ingles) + '%)'), ('outros (' + str(total_outros) + '%)')],
'total':[total_ingles, total_outros]
}
dados = pd.DataFrame(dados)
sns.barplot(data=dados, x='lingua', y='total')
Fiz essa pequena ginástica pra justificar meu (injustificadamente) amado gráfico de pizza, mas acaba podendo ser bastante útil em outros formatos de gráfico, então pensei que poderia ser interessante pra alguém se compartilhasse aqui haha