Solucionado (ver solução)
Solucionado
(ver solução)
1
resposta

[Projeto] Visualizando os dados da base

import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

tmdb = pd.read_csv("https://raw.githubusercontent.com/alura-cursos/data-science-analise-exploratoria/main/Aula_0/tmdb_5000_movies.csv")

# Preparação dos dados
contagem_de_lingua = tmdb["original_language"].value_counts().to_frame().reset_index()
contagem_de_lingua.columns = ["original_language", "total"]

#  Gráfico 1 - Barplot (manual) 
plt.figure()
sns.barplot(x="original_language", y="total", data=contagem_de_lingua)
plt.title("Quantidade de filmes por idioma (barplot)")
plt.xticks(rotation=45)
plt.show()

#  Gráfico 2 - Countplot 
plt.figure()
sns.countplot(data=tmdb, x="original_language")
plt.title("Contagem de filmes por idioma (countplot)")
plt.xticks(rotation=45)
plt.show()

#  Preparar dados agrupados (inglês vs outros) 
total_por_lingua = tmdb["original_language"].value_counts()
total_geral = total_por_lingua.sum()
total_de_ingles = total_por_lingua.loc["en"]
total_do_resto = total_geral - total_de_ingles

dados = pd.DataFrame({
    "lingua": ["ingles", "outros"],
    "total": [total_de_ingles, total_do_resto]
})

#  Gráfico 3 - Inglês vs outros 
plt.figure()
sns.barplot(x="lingua", y="total", data=dados)
plt.title("Comparação: Inglês vs Outros idiomas")
plt.show()
import matplotlib.pyplot as plt

# Dados já preparados
labels = dados["lingua"]
valores = dados["total"]

# Criar gráfico de pizza
plt.figure()
plt.pie(valores, labels=labels, autopct="%1.1f%%", startangle=90)

plt.title("Distribuição de filmes: Inglês vs Outros idiomas")

plt.show()
1 resposta
solução!

Oi, Cássio! Como vai?

Agradeço por compartilhar seu código com a comunidade Alura.

Você organizou bem a análise, separando bem cada etapa e comparando diferentes tipos de gráficos como barplot, countplot e até o gráfico de pizza. Isso mostra um bom entendimento de como explorar os dados de maneiras diferentes para extrair insights mais claros.

Continue assim!

Uma dica interessante para o futuro é usar o metodo sort_values() para ordenar os dados antes de plotar. Veja este exemplo:


dados_ordenados = contagem_de_lingua.sort_values(by="total", ascending=False)
sns.barplot(x="original_language", y="total", data=dados_ordenados)

Esse codigo ordena os idiomas do maior para o menor, deixando o grafico mais intuitivo para analise visual.

Qualquer dúvida que surgir, compartilhe no fórum. Abraços e bons estudos!

Para se aprofundar no tema:
Alura

Conte com o apoio da comunidade Alura na sua jornada. Abraços e bons estudos!