1
resposta

Quantidade real do primeiro quartil

Bom dia. Fiquei com dúvida na aula sobre quartil. O professor aplicou a função dados.Renda.quantile([0.25, 0.5, 0.75]) que obteve o seguinte resultado:

0.25     788.0
0.50    1200.0
0.75    2000.0
Name: Renda, dtype: float64

Na explicação, o professor comentou que 25% dos valores estão compreendidos entre 0 e 788 incluso. No entanto, eu fiz o seguinte cáclulo:

valor_25 = dados.query('Renda <= 788.0')['Renda'].count() #Quantidade de registros compreendidas no primeiro quartil
total = dados.Renda.count()
valor_25 * 100 / total

O resultado foi 28.867777199375325%

Se entendi bem, o resulado não deveria ser um número até 25%?

1 resposta

Oi, Thaudeu! Como vai?

A função quantile() do pandas realmente retorna os valores que separam a distribuição em partes iguais. No entanto, quando você está calculando a porcentagem de valores menores ou iguais a 788.0, você está considerando também valores que estão no segundo quartil.

Quando dizemos que 788.0 é o primeiro quartil, isso significa que 25% dos valores são menores ou iguais a 788.0. No entanto, isso não significa que todos os valores menores ou iguais a 788.0 estão no primeiro quartil. Alguns desses valores podem estar no segundo quartil.

O quartil 25% é apenas o número que separa a base de dados em 25% de um lado e 75% do outro - isso é referente à quantidade de linhas, não aos valores que estão nessas linhas. Essa medida é útil para compreender melhor a distribuição dos dados.

Espero que tenha ficado um pouco mais claro, Thadeu! Achei muito legal que você ficou em dúvida e testou com código, mandou bem demais!

Abração!

Caso este post tenha lhe ajudado, por favor, marcar como solucionado ✓. Bons Estudos!

Quer mergulhar em tecnologia e aprendizagem?

Receba a newsletter que o nosso CEO escreve pessoalmente, com insights do mercado de trabalho, ciência e desenvolvimento de software