1
resposta

[Sugestão] Extrair os dados com describe()

Sugestão para extrair os dados apresentados no .describe()

import pandas as pd

notas = pd.read_csv("https://raw.githubusercontent.com/alura-cursos/data-science-analise-exploratoria/main/Aula_0/ml-latest-small/ratings.csv")
notas.head()
notas.columns = ["usuarioId", "filmeId", "nota", "momento"]
notas.head()
#notas['nota'].unique()
#notas['nota'].value_counts()

#notas["nota"].plot(kind='hist')

#import seaborn as sns
#sns.boxplot(notas["nota"])
minimo = notas["nota"].describe()["min"]
maximo = notas["nota"].describe()["max"]
media = notas["nota"].describe()["mean"]
valor75 = notas["nota"].describe()["75%"]
valor50 = notas["nota"].describe()["50%"]
valor25 = notas["nota"].describe()["25%"]
print(f"Minimo: {minimo}\nMáximo: {maximo}\nMédia: {media}")
print(f"75%: {valor75}\n50%: {valor50}\n25%: {valor25}")
1 resposta

Boa tarde Paulo!

Obrigado por compartilhar seu código com a comunidade Alura. Seu código está funcionando corretamente, como mostro abaixo:

Tabela com os principais indicadores estatísticos de um conjunto de dados, incluindo valor mínimo, máximo, média e percentis 25%, 50% e 75%.

Uma dica é arredondar os valores da média para melhorar a apresentação:

media = round(estatisticas_nota["mean"], 2)

Conte com o apoio do Fórum na sua jornada.

Abraços e bons estudos!