Solucionado (ver solução)
Solucionado
(ver solução)
1
resposta

[Projeto] Conhecendo a base de notas dos filmes

import pandas as pd
import matplotlib.pyplot as plt

# Carregar os dados
notas = pd.read_csv("https://raw.githubusercontent.com/alura-cursos/data-science-analise-exploratoria/main/Aula_0/ml-latest-small/ratings.csv")

# Ajustar nomes das colunas
notas.columns = ["usuarioId", "filmeId", "nota", "momento"]

# Visualizar primeiras linhas
print(notas.head())

# Valores únicos
print("\nValores únicos das notas:")
print(notas['nota'].unique())

# Contagem de frequência
print("\nFrequência das notas:")
print(notas['nota'].value_counts())

# Histograma
notas["nota"].plot(kind='hist')
plt.title("Distribuição das Notas")
plt.xlabel("Notas")
plt.ylabel("Frequência")
plt.show()

# Média arredondada para 1 casa decimal
media = notas["nota"].mean().round(1)
print("\nMédia das notas (arredondada):", media)

# Mediana
mediana = notas["nota"].median()
print("Mediana das notas:", mediana)

# Resumo estatístico
print("\nResumo estatístico:")
print(notas["nota"].describe())
1 resposta
solução!

Ei! Tudo bem, Cássio?

Seu projeto ficou muito bem estruturado, parabéns!

Gostei que você incluiu média, mediana e o describe(), isso já dá uma visão estatística bem sólida da distribuição das notas.

Um ponto legal de evolução seria explorar mais a visualização, como ajustar bins do histograma ou até testar um gráfico de densidade. Também poderia cruzar dados depois, como notas por usuário ou por filme.

Excelente trabalho, continue se dedicando e qualquer dúvida compartilhe no fórum.

Alura Conte com o apoio da comunidade Alura na sua jornada. Abraços e bons estudos!