1
resposta

Dúvida na inclusão do zero

Entendo que a alteração da contagem no label "1 e 2 quartos" tenha sido alterada devido à inclusão dos imóveis com 0 quartos, mas não entendi o porquê dos imóveis com zero quatros entrarem nesta faixa, pois previamente no vídeo (3:58) é informado que o zero não entraria durante a explicação do out.

(0, 2]      11074
(2, 4]       8094
(4, 6]        470
(6, 100]       36
1 resposta

Olá Marcelo tudo bem com você??

Conforme explicado, no resultado, e visualizado na transcrição:

"O caractere ( significa que o intervalo é aberto. Já [, significa que o intervalo é fechado. Então, já temos a frequência, mas podemos modificá-la criando um labels, passando a lista que desejamos organizar"

labels = ['1 e 2 quartos', '3 e 4 quartos', '5 e 6 quartos', '7 quartos ou mais' ]

Após o tratamento da informação, esses intervalos citados acima, serão expostos de maneira mais clara para a análise:

quartos = pd.cut(dados.Quartos, classes, labels = labels)

pd.value_counts(quartos)

1 e 2 quartos 11074

3 e 4 quartos 8094

5 e 6 quartos 470

7 quartos ou mais 36

Name: Quartos, dtype: int64

Finalizando com uma percepção de que mesmo após o tratamento, existem informações "mascaradas"

Para isso é usado:

quartos = pd.cut(dados.Quartos, classes, labels = labels, include_lowest = True)

Mostrando que existem imóveis com 0 quartos, então precisaremos tratar melhor a base. Pois a informação através da quantidade de quartos, seja 0 ou 7 ela consta no nosso Dataset desde o início e a forma como será visualizado e optaremos tratar esses dados vai variar do que buscamos de resposta para nossa análise.

Ficou mais claro? Se a sua dúvida ainda permanecer é só voltar aqui!