Solucionado (ver solução)
Solucionado
(ver solução)
1
resposta

Problemas de Seed

No minuto 4:08 o resultado de

modelo = KMeans(n_clusters=3)
modelo.fit(generos_escalados)

é:

[1 1 2...0 1 2]

e no minuto 5:03 é :

[1 1 0 ... 0 1 0]

Aparentemente é necessário fixar a SEED do algorítimo. Se fizermos:

import pandas as pd
import numpy as np
SEED = 5
np.random.seed(SEED)

logo na primeira célula, o problema não ocorre mais, desde que o código seja rodado em bloco.

1 resposta
solução!

Olá Vagner.

Você está correto, diversos modelos utilizam números aleatórios então se quisermos que nosso experimento seja replicável, precisamos fixar uma SEED e assim resolver essa questão.

Como podemos ver na documentação, podemos colocar essa SEED no momento em que criamos o objeto do modelo.

modelo = KMeans(n_clusters=3,  random_state=5)
modelo.fit(generos_escalados)

Mas acredito que a sua solução é a melhor, porque garantimos que qualquer modelo que estivermos usando no nosso experimento vai usar aquela SEED já que por padrão eles sempre pegam o SEED no numpy (documentação).

import numpy as np
SEED = 5
np.random.seed(SEED)

Bons Estudos.