1
resposta

NaN dentro da matriz categorizada

Fiz conforme a aula, mas a resposta do pd.cut da diferente:

classes = [0, 2, 4, 6, 100]
quartos

0        (0.0, 2.0]
1        (0.0, 2.0]
2               NaN
3        (0.0, 2.0]
4        (0.0, 2.0]
            ...    
32955           NaN
32956    (2.0, 4.0]
32957    (0.0, 2.0]
32958    (0.0, 2.0]
32959           NaN
Name: Quartos, Length: 32960, dtype: category
Categories (4, interval[int64]): [(0, 2] < (2, 4] < (4, 6] < (6, 100]]

Na contagem dos quartos de cada intervalo tambem esta dando diferente:

pd.value_counts(quartos)

(0, 2]      12419
(2, 4]       9894
(4, 6]        709
(6, 100]       87
Name: Quartos, dtype: int64

Qual a causa de dar resultados diferentes neste caso ?

1 resposta

Oii Keigo, tudo bem?

Desculpa a demora, não sei se já conseguiu solucionar o problema, mas eu testei aqui e acredito que você esteja usando o arquivo 'aluguel.csv' das aulas normais.

Existem dois arquivos com o mesmo nome, um para as aulas gerais do curso e outro apenas para as aulas extras e o conteúdo deles é diferente. Após a troca do arquivo, do 'aluguel.csv' das aulas para o 'aluguel.csv' das aulas extras, você vai ter os mesmos resultados que o instrutor!

Caso ainda tenha alguma dúvida, estou por aqui, tudo bem? :)