Solucionado (ver solução)
Solucionado
(ver solução)
1
resposta

Outlier

Boa noite, Como eu verifico os outlier no conjunto de dados? Eu preciso fazer a verificação dos outlier para todas as variáveis individualmente? Ex: (tipo x valor), (bairro x valor), (quartos x valor)...

1 resposta
solução!

Oi Tatiane! Tudo bem com você?

A verificação de outlier bem como outras características que precisariam de tratamento são feitas de características por características. No entanto, devemos considerar que cada coluna tem seu tipo de dado específico, por exemplo, dados numéricos, dados em texto, entre outros.

Então as análises pra cada tipo de dado serão um pouco diferentes. Quando falamos de valores numéricos consideramos que pode haver outliers e por isso, neles precisamos fazer a verificação. No caso da nossa base de dados, apenas nas colunas tipo e bairro nós não faremos as verificação de outliers com boxplot (pois são valores em texto). Para as demais colunas podemos usar o boxplot juntamente com um gráfico de distribuição (em barras) para verificar a presença de outliers. Aqui vale verificar cada caso, pois podem haver valores que mesmo que sejam muito altos ou muito baixos, eles façam sentido para o conjunto de dados.

Espero ter te ajudado. Bons estudos!

Quer mergulhar em tecnologia e aprendizagem?

Receba a newsletter que o nosso CEO escreve pessoalmente, com insights do mercado de trabalho, ciência e desenvolvimento de software