import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
# Carregar dados
tmdb = pd.read_csv("https://raw.githubusercontent.com/alura-cursos/data-science-analise-exploratoria/main/Aula_0/tmdb_5000_movies.csv")
# Filtrar sem inglês
outros = tmdb.query("original_language != 'en'")
# Contagem e percentual
percentual = (
outros["original_language"]
.value_counts(normalize=True) * 100
).reset_index()
percentual.columns = ["original_language", "percentual"]
# Ordenar
percentual = percentual.sort_values(by="percentual", ascending=False)
# Gráfico
plt.figure(figsize=(16, 8))
sns.barplot(
data=percentual,
x="original_language",
y="percentual",
palette="mako"
)
plt.xticks(rotation=45)
plt.ylabel("Percentual (%)")
plt.xlabel("Idioma")
plt.title("Distribuição percentual dos idiomas (exceto inglês)")
plt.show()