import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
tmdb = pd.read_csv("https://raw.githubusercontent.com/alura-cursos/data-science-analise-exploratoria/main/Aula_0/tmdb_5000_movies.csv")
# Preparação dos dados
contagem_de_lingua = tmdb["original_language"].value_counts().to_frame().reset_index()
contagem_de_lingua.columns = ["original_language", "total"]
# Gráfico 1 - Barplot (manual)
plt.figure()
sns.barplot(x="original_language", y="total", data=contagem_de_lingua)
plt.title("Quantidade de filmes por idioma (barplot)")
plt.xticks(rotation=45)
plt.show()
# Gráfico 2 - Countplot
plt.figure()
sns.countplot(data=tmdb, x="original_language")
plt.title("Contagem de filmes por idioma (countplot)")
plt.xticks(rotation=45)
plt.show()
# Preparar dados agrupados (inglês vs outros)
total_por_lingua = tmdb["original_language"].value_counts()
total_geral = total_por_lingua.sum()
total_de_ingles = total_por_lingua.loc["en"]
total_do_resto = total_geral - total_de_ingles
dados = pd.DataFrame({
"lingua": ["ingles", "outros"],
"total": [total_de_ingles, total_do_resto]
})
# Gráfico 3 - Inglês vs outros
plt.figure()
sns.barplot(x="lingua", y="total", data=dados)
plt.title("Comparação: Inglês vs Outros idiomas")
plt.show()
import matplotlib.pyplot as plt
# Dados já preparados
labels = dados["lingua"]
valores = dados["total"]
# Criar gráfico de pizza
plt.figure()
plt.pie(valores, labels=labels, autopct="%1.1f%%", startangle=90)
plt.title("Distribuição de filmes: Inglês vs Outros idiomas")
plt.show()