Na aula, após apresentar a visualisação através do boxplot, o professor diz que temos 25% entre 3 e 3,5 e entre 3,5 e 4. Apenas vendo o gráfico eu não consegui compreender como foi tirada a conclusão.
Na aula, após apresentar a visualisação através do boxplot, o professor diz que temos 25% entre 3 e 3,5 e entre 3,5 e 4. Apenas vendo o gráfico eu não consegui compreender como foi tirada a conclusão.
Olá, Alan! Tudo bem com você?
Essa informação foi retirada da interpretação do boxplot que o instrutor obteve. Vamos primeiro entender como são as medidas em um boxplot.
Onde:
Na imagem temos algumas informações extras, como Li que é o limite inferior, valores abaixo desse valor são considerados outliers (valores atípicos). Para Ls temos a mesma interpretação, valores acima desse valor são valores atípicos. E temos também o Intervalo interquartil que é o RIC no boxplot.
O boxplot obtido pelo instrutor foi:
Portando temos que:
Como cada quartil representa 25% de concentração dos dados, temos que entre o valor 3 e 3.5 (ou seja do Q1 para o Q2) temos 25% dos dados, pois Q1 representa 25% dos dados abaixo e Q2 50%, logo entre Q1 e Q2 há 25% (50% - 25% = 25%) dos dados. Entre 3.5 e 4 (Q2 e Q3) é a mesma ideia, como Q2 representa o valor onde há 50% dos dados abaixo e Q3 75%, entre Q2 e Q3 há 25% dos dados (75% - 50% = 25%).
Vou deixar o link de algumas resposta em outros tópicos que podem te ajudar a entender melhor a interpretação do boxplot:
Espero ter ajudado, mas se ainda persistir alguma dúvida estou sempre à disposição.
:)