1
resposta

[Dúvida] Boxblot diferente

O que quer dizer quando um boxblot fica assim?

Insira aqui a descrição dessa imagem para ajudar na acessibilidade

Ele deveria ter ficado assim:

Insira aqui a descrição dessa imagem para ajudar na acessibilidade

Foi algo que errei no código? Ou isso é alguma configuração do seanborn?

1 resposta

Oii, Romeu! Tudo bem?

A diferença nos boxplots pode estar relacionada à presença de outliers ou à forma como os dados foram filtrados. O primeiro boxplot possui uma distribuição mais ampla, enquanto o segundo está mais ajustado, que é o retorno que temos após a remoção de outliers.

Sendo assim, peço, por gentileza, que verifique o seu código para comparar se está certo, removendo os outliers. Deixo abaixo o código usado em aula para você comparar:

df_sem_out[outliers_index]['cliente.tempo_servico']

Q1 = df_sem_out['cliente.tempo_servico'].quantile(.25)
Q3 = df_sem_out['cliente.tempo_servico'].quantile(.75)
IQR = Q3-Q1
limite_inferior = Q1 - 1.5*IQR
limite_superior = Q3 + 1.5*IQR

outliers_index = (df_sem_out['cliente.tempo_servico'] < limite_inferior) | (df_sem_out['cliente.tempo_servico'] > limite_superior)
outliers_index

df_sem_out[outliers_index]

df_sem_out = df_sem_out[~outliers_index]
df_sem_out

sns.boxplot(x=df_sem_out['cliente.tempo_servico'])

df_sem_out.reset_index(drop=True, inplace=True)

df_sem_out

E segue o link do notebook usado para teste apresentando o gráfico como a segunda imagem:

Espero que a sugestão e código de teste seja útil. Conte sempre conosco para te ajudar.

Bons estudos e até mais!