0
respostas

[Projeto] Visualizando os dados da base

import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

tmdb = pd.read_csv("https://raw.githubusercontent.com/alura-cursos/data-science-analise-exploratoria/main/Aula_0/tmdb_5000_movies.csv")

# Preparação dos dados
contagem_de_lingua = tmdb["original_language"].value_counts().to_frame().reset_index()
contagem_de_lingua.columns = ["original_language", "total"]

#  Gráfico 1 - Barplot (manual) 
plt.figure()
sns.barplot(x="original_language", y="total", data=contagem_de_lingua)
plt.title("Quantidade de filmes por idioma (barplot)")
plt.xticks(rotation=45)
plt.show()

#  Gráfico 2 - Countplot 
plt.figure()
sns.countplot(data=tmdb, x="original_language")
plt.title("Contagem de filmes por idioma (countplot)")
plt.xticks(rotation=45)
plt.show()

#  Preparar dados agrupados (inglês vs outros) 
total_por_lingua = tmdb["original_language"].value_counts()
total_geral = total_por_lingua.sum()
total_de_ingles = total_por_lingua.loc["en"]
total_do_resto = total_geral - total_de_ingles

dados = pd.DataFrame({
    "lingua": ["ingles", "outros"],
    "total": [total_de_ingles, total_do_resto]
})

#  Gráfico 3 - Inglês vs outros 
plt.figure()
sns.barplot(x="lingua", y="total", data=dados)
plt.title("Comparação: Inglês vs Outros idiomas")
plt.show()
import matplotlib.pyplot as plt

# Dados já preparados
labels = dados["lingua"]
valores = dados["total"]

# Criar gráfico de pizza
plt.figure()
plt.pie(valores, labels=labels, autopct="%1.1f%%", startangle=90)

plt.title("Distribuição de filmes: Inglês vs Outros idiomas")

plt.show()