O que quer dizer quando um boxblot fica assim?
Ele deveria ter ficado assim:
Foi algo que errei no código? Ou isso é alguma configuração do seanborn?
O que quer dizer quando um boxblot fica assim?
Ele deveria ter ficado assim:
Foi algo que errei no código? Ou isso é alguma configuração do seanborn?
Oii, Romeu! Tudo bem?
A diferença nos boxplots pode estar relacionada à presença de outliers ou à forma como os dados foram filtrados. O primeiro boxplot possui uma distribuição mais ampla, enquanto o segundo está mais ajustado, que é o retorno que temos após a remoção de outliers.
Sendo assim, peço, por gentileza, que verifique o seu código para comparar se está certo, removendo os outliers. Deixo abaixo o código usado em aula para você comparar:
df_sem_out[outliers_index]['cliente.tempo_servico']
Q1 = df_sem_out['cliente.tempo_servico'].quantile(.25)
Q3 = df_sem_out['cliente.tempo_servico'].quantile(.75)
IQR = Q3-Q1
limite_inferior = Q1 - 1.5*IQR
limite_superior = Q3 + 1.5*IQR
outliers_index = (df_sem_out['cliente.tempo_servico'] < limite_inferior) | (df_sem_out['cliente.tempo_servico'] > limite_superior)
outliers_index
df_sem_out[outliers_index]
df_sem_out = df_sem_out[~outliers_index]
df_sem_out
sns.boxplot(x=df_sem_out['cliente.tempo_servico'])
df_sem_out.reset_index(drop=True, inplace=True)
df_sem_out
E segue o link do notebook usado para teste apresentando o gráfico como a segunda imagem:
Espero que a sugestão e código de teste seja útil. Conte sempre conosco para te ajudar.
Bons estudos e até mais!