0
respostas

[Projeto] Refinando o gráfico das línguas

import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

# Carregar dados
tmdb = pd.read_csv("https://raw.githubusercontent.com/alura-cursos/data-science-analise-exploratoria/main/Aula_0/tmdb_5000_movies.csv")

# Filtrar sem inglês
outros = tmdb.query("original_language != 'en'")

# Contagem e percentual
percentual = (
    outros["original_language"]
    .value_counts(normalize=True) * 100
).reset_index()

percentual.columns = ["original_language", "percentual"]

# Ordenar
percentual = percentual.sort_values(by="percentual", ascending=False)

#  Gráfico
plt.figure(figsize=(16, 8))

sns.barplot(
    data=percentual,
    x="original_language",
    y="percentual",
    palette="mako"
)

plt.xticks(rotation=45)
plt.ylabel("Percentual (%)")
plt.xlabel("Idioma")
plt.title("Distribuição percentual dos idiomas (exceto inglês)")

plt.show()