[Projeto] Visualizando os dados da base

import pandas as pd import seaborn as sns import matplotlib.pyplot as plt tmdb = pd.read_csv("https://raw.githubusercontent.com/alura-cursos/data-science-analise-exploratoria/main/Aula_0/tmdb_5000_movies.csv") # Preparação dos dados contagem_de_lingua = tmdb["original_language"].value_counts().to_frame().reset_index() contagem_de_lingua.columns = ["original_language", "total"] # Gráfico 1 - Barplot (manual) plt.figure() sns.barplot(x="original_language", y="total", data=contagem_de_lingua) plt.title("Quantidade de filmes por idioma (barplot)") plt.xticks(rotation=45) plt.show() # Gráfico 2 - Countplot plt.figure() sns.countplot(data=tmdb, x="original_language") plt.title("Contagem de filmes por idioma (countplot)") plt.xticks(rotation=45) plt.show() # Preparar dados agrupados (inglês vs outros) total_por_lingua = tmdb["original_language"].value_counts() total_geral = total_por_lingua.sum() total_de_ingles = total_por_lingua.loc["en"] total_do_resto = total_geral - total_de_ingles dados = pd.DataFrame({ "lingua": ["ingles", "outros"], "total": [total_de_ingles, total_do_resto] }) # Gráfico 3 - Inglês vs outros plt.figure() sns.barplot(x="lingua", y="total", data=dados) plt.title("Comparação: Inglês vs Outros idiomas") plt.show() import matplotlib.pyplot as plt # Dados já preparados labels = dados["lingua"] valores = dados["total"] # Criar gráfico de pizza plt.figure() plt.pie(valores, labels=labels, autopct="%1.1f%%", startangle=90) plt.title("Distribuição de filmes: Inglês vs Outros idiomas") plt.show()

Oi, Cássio! Como vai?

Agradeço por compartilhar seu código com a comunidade Alura.

Você organizou bem a análise, separando bem cada etapa e comparando diferentes tipos de gráficos como barplot, countplot e até o gráfico de pizza. Isso mostra um bom entendimento de como explorar os dados de maneiras diferentes para extrair insights mais claros.

Continue assim!

Uma dica interessante para o futuro é usar o metodo sort_values() para ordenar os dados antes de plotar. Veja este exemplo:


dados_ordenados = contagem_de_lingua.sort_values(by="total", ascending=False)
sns.barplot(x="original_language", y="total", data=dados_ordenados)

Esse codigo ordena os idiomas do maior para o menor, deixando o grafico mais intuitivo para analise visual.

Qualquer dúvida que surgir, compartilhe no fórum. Abraços e bons estudos!

Para se aprofundar no tema:

ARTIGO

pandas.DataFrame.sort_values

Conte com o apoio da comunidade Alura na sua jornada. Abraços e bons estudos!

Importante

Trilhas por carreira

Carreiras de IA

Carreiras de Dados

Carreiras de Cyber

Carreiras de DevOps & Cloud

Carreiras de UX & UI

Carreiras de Mobile & Front-End

Carreiras de Back-End

Carreiras de Negócios

Cursos universitários FIAP