Solucionado (ver solução)
Solucionado
(ver solução)
2
respostas

O que é um Quantil ?

Me restou uma dúvida sobre esses tipo de gráfico da aula, não entendi direito da onde sair os valores que são usados nessas porcentagens,

Q1 = valor.quantile(.25)
Q3 = valor.quantile(.75)
IIQ = Q3 - Q1
limite_inferior = Q1 - 1.5 * IIQ
limite_superior = Q3 + 1.5 * IIQ
2 respostas
solução!

Olá, Alexandre! Tudo bem com você?

Quantil indicam posições em um conjunto de dados, sua principal função é dividir os dados com os quais você está trabalhando em q subconjuntos. O quantil p é o valor que irá fazer a divisão do conjunto de dados em p * 100% abaixo e (1-p) 100% acima. Falando assim talvez fique um pouco confuso, então valor para um exemplo:

Suponha que você tenha o seguinte conjunto de dados:

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10]

Realizada pelo código:

import pandas as pd

x = [i for i in range(11)]
df = pd.DataFrame(x)
q1 = df.quantile(.25)
q1

Saída:

2.5

Queremos fazer uma divisão dos nossos dados em 4 quantis, chamado de quartil. Então queremos fazer a divisão em 25% , 50% e 75% dos dados. No código acima estamos passando q1 = df.quantile(.25), aqui queremos o valor que divide nosso conjunto de dados [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10] em 0.25 * 100% (ou 25%) abaixo e (1-0.25) * 100% (ou 75%) acima, que nesse exemplo é o valor 2.5. Se quiséssemos dividir nosso conjunto de dados no segundo quartil, ou seja de 50% dos dados, teríamos o valor que divide nosso conjunto de dados em 50% abaixo e 50% acima, em outras palavras teríamos a mediana que no nosso exemplo é o número 5, podemos comprovar isso com o código abaixo:

import pandas as pd

x = [i for i in range(11)]
df = pd.DataFrame(x)
q1 = df.quantile(.50)
q1

Saída:

5.0

O mesmo vale para o 3 quartil, que é 75%, seria retornado o valor que divide nosso conjunto de dados em 75% abaixo dele e 25% acima dele. Conforme o número de divisões de quantis nomeia-se de forma específica, como por exemplo:

Alguns quantis têm nomes especiais:

  • Os 100-quantis são chamados percentis
  • Os 10-quantis são chamados decis
  • Os 4-quantis são chamados quartis
  • OS 3-quantis são chamados tercis

Na imagem abaixo está exemplificado como é feita a divisão do quartil, o mesmo vale para as outras divisões acima.

Representação de um quartil em uma escala de dados ordenados com 4 divisões de 25% cada representando o primeiro quartil, segundo quartil ou mediana e o terceiro quartil.

No código enviado por você estamos trabalhando com o quartil, assim como no exemplo mostrado anteriormente, então quando é executada a linha de código Q1 = valor.quantile(.25) estamos atribuindo à variável Q1 o número que divide a variável valor em 25% abaixo e 75% acima desse número. O mesmo vale para o trecho Q3 = valor.quantile(.75), está sendo atribuído o número que divide a variável valor em 75% abaixo desse número e 25% acima. O restante do código é usado para calcular os limites para fazer a remoção dos potenciais outliers, que são dados que se diferenciam muito dos outros.

Espero ter ajudado, mas se ainda persistir alguma dúvida estou sempre à disposição.

:)

Caso este post tenha lhe ajudado, por favor, marcar como solucionado ✓.Bons Estudos!

Muito obrigado, me ajudou muito, ja não me resta nenhuma dúvida

Quer mergulhar em tecnologia e aprendizagem?

Receba a newsletter que o nosso CEO escreve pessoalmente, com insights do mercado de trabalho, ciência e desenvolvimento de software