[Projeto] Refinando o gráfico das línguas

import pandas as pd import seaborn as sns import matplotlib.pyplot as plt # Carregar dados tmdb = pd.read_csv("https://raw.githubusercontent.com/alura-cursos/data-science-analise-exploratoria/main/Aula_0/tmdb_5000_movies.csv") # Filtrar sem inglês outros = tmdb.query("original_language != 'en'") # Contagem e percentual percentual = ( outros["original_language"] .value_counts(normalize=True) * 100 ).reset_index() percentual.columns = ["original_language", "percentual"] # Ordenar percentual = percentual.sort_values(by="percentual", ascending=False) # Gráfico plt.figure(figsize=(16, 8)) sns.barplot( data=percentual, x="original_language", y="percentual", palette="mako" ) plt.xticks(rotation=45) plt.ylabel("Percentual (%)") plt.xlabel("Idioma") plt.title("Distribuição percentual dos idiomas (exceto inglês)") plt.show()

Oi, Cássio! Como vai?

Agradeço por compartilhar seu código com a comunidade Alura.

Estou gostando de ver o seu progresso! Você estruturou bem todo o fluxo: filtrou os dados, calculou o percentual com value_counts(normalize=True) e ainda organizou com sort_values. O uso do seaborn com rotação no eixo X deixou o gráfico mais legível, o que é importante na análise visual.

Continue assim! ✨

Qualquer dúvida que surgir, compartilhe no fórum. Abraços e bons estudos!

Para começar:

CARREIRA

Ciência de Dados

Conte com o apoio da comunidade Alura na sua jornada. Abraços e bons estudos!

Importante

Trilhas por carreira

Carreiras de IA

Carreiras de Dados

Carreiras de Cyber

Carreiras de DevOps & Cloud

Carreiras de UX & UI

Carreiras de Mobile & Front-End

Carreiras de Back-End

Carreiras de Negócios

Cursos universitários FIAP