Olá, Alexandre! Tudo bem com você?
Quantil indicam posições em um conjunto de dados, sua principal função é dividir os dados com os quais você está trabalhando em q subconjuntos. O quantil p é o valor que irá fazer a divisão do conjunto de dados em p * 100% abaixo e (1-p) 100% acima. Falando assim talvez fique um pouco confuso, então valor para um exemplo:
Suponha que você tenha o seguinte conjunto de dados:
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
Realizada pelo código:
import pandas as pd
x = [i for i in range(11)]
df = pd.DataFrame(x)
q1 = df.quantile(.25)
q1
Saída:
2.5
Queremos fazer uma divisão dos nossos dados em 4 quantis, chamado de quartil. Então queremos fazer a divisão em 25% , 50% e 75% dos dados. No código acima estamos passando q1 = df.quantile(.25)
, aqui queremos o valor que divide nosso conjunto de dados [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
em 0.25 * 100% (ou 25%) abaixo e (1-0.25) * 100% (ou 75%) acima, que nesse exemplo é o valor 2.5. Se quiséssemos dividir nosso conjunto de dados no segundo quartil, ou seja de 50% dos dados, teríamos o valor que divide nosso conjunto de dados em 50% abaixo e 50% acima, em outras palavras teríamos a mediana que no nosso exemplo é o número 5, podemos comprovar isso com o código abaixo:
import pandas as pd
x = [i for i in range(11)]
df = pd.DataFrame(x)
q1 = df.quantile(.50)
q1
Saída:
5.0
O mesmo vale para o 3 quartil, que é 75%, seria retornado o valor que divide nosso conjunto de dados em 75% abaixo dele e 25% acima dele. Conforme o número de divisões de quantis nomeia-se de forma específica, como por exemplo:
Alguns quantis têm nomes especiais:
- Os 100-quantis são chamados percentis
- Os 10-quantis são chamados decis
- Os 4-quantis são chamados quartis
- OS 3-quantis são chamados tercis
Na imagem abaixo está exemplificado como é feita a divisão do quartil, o mesmo vale para as outras divisões acima.
No código enviado por você estamos trabalhando com o quartil, assim como no exemplo mostrado anteriormente, então quando é executada a linha de código Q1 = valor.quantile(.25)
estamos atribuindo à variável Q1
o número que divide a variável valor
em 25% abaixo e 75% acima desse número. O mesmo vale para o trecho Q3 = valor.quantile(.75)
, está sendo atribuído o número que divide a variável valor
em 75% abaixo desse número e 25% acima. O restante do código é usado para calcular os limites para fazer a remoção dos potenciais outliers, que são dados que se diferenciam muito dos outros.
Espero ter ajudado, mas se ainda persistir alguma dúvida estou sempre à disposição.
:)
Caso este post tenha lhe ajudado, por favor, marcar como solucionado ✓.Bons Estudos!