1
resposta

[Projeto] Refinando o gráfico das línguas

import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

# Carregar dados
tmdb = pd.read_csv("https://raw.githubusercontent.com/alura-cursos/data-science-analise-exploratoria/main/Aula_0/tmdb_5000_movies.csv")

# Filtrar sem inglês
outros = tmdb.query("original_language != 'en'")

# Contagem e percentual
percentual = (
    outros["original_language"]
    .value_counts(normalize=True) * 100
).reset_index()

percentual.columns = ["original_language", "percentual"]

# Ordenar
percentual = percentual.sort_values(by="percentual", ascending=False)

#  Gráfico
plt.figure(figsize=(16, 8))

sns.barplot(
    data=percentual,
    x="original_language",
    y="percentual",
    palette="mako"
)

plt.xticks(rotation=45)
plt.ylabel("Percentual (%)")
plt.xlabel("Idioma")
plt.title("Distribuição percentual dos idiomas (exceto inglês)")

plt.show()
1 resposta

Oi, Cássio! Como vai?

Agradeço por compartilhar seu código com a comunidade Alura.

Estou gostando de ver o seu progresso! Você estruturou bem todo o fluxo: filtrou os dados, calculou o percentual com value_counts(normalize=True) e ainda organizou com sort_values. O uso do seaborn com rotação no eixo X deixou o gráfico mais legível, o que é importante na análise visual.

Continue assim! ✨

Qualquer dúvida que surgir, compartilhe no fórum. Abraços e bons estudos!

Para começar:
Alura Conte com o apoio da comunidade Alura na sua jornada. Abraços e bons estudos!