# importando os csv
filmes = pd.read_csv("movies.csv")
notas = pd.read_csv("ratings.csv")
# Alterando os nomes das colunas
notas.columns = ["usuarioID", "filmeID", "nota", "momento"]
notas.head()
# Descrevendo as notas de cada filme
notas.nota.describe
# Gerando grafico das notas dos filmes
notas.nota.plot(kind="hist")
# gerando grafico do tipo boxplot com a biblioteca seaborn
import seaborn as sns
sns.boxplot(notas.nota)
# query para gerar media por filme de forma unitaria
notas.query("filmeID==1").nota.mean()
notas.query("filmeID==2").nota.mean()
# gerando medias dos filmes de uma unica vez os agrupando utilizando groupby e pegando a media da coluna nota
media_nota_por_filme = notas.groupby("filmeID").mean()["nota"]
media_nota_por_filme