Solucionado (ver solução)
Solucionado
(ver solução)
1
resposta

Dúvida no número inicial SEED

Olá pessoal!

Eu li dois tópicos referentes ao SEED passado por parâmetro random_state na função train_test_split e ainda não consegui entender o sentido desse parâmetro. Se alguém tiver paciência de me explicar eu agradeço.

1 resposta
solução!

Olá Paulo, tudo bem ? Espero que sim.

O SEED vai ser usado pelo numpy para gerar um numero pseudoaleatório, e esse parâmetro é interesse para nos porque vamos poder reproduzir os nosso resultados, por exemplo no caso do train_test_split, se não utilizarmos o SEED teremos o dado separado de uma maneira diferente toda vez que rodarmos o nosso notebook, mantendo um SEED você pode reproduzir os mesmo resultados.

Então por exemplo, utilizando o mesmo SEED que o instrutor, você terá o mesmo resultado que ele teve. Além do train_test_split outros algoritmos no seu código podem usar a aleatoriedade dentro deles, se quiser garantir que todos os seus resultados possam ser reproduzidos, você pode atribuir o SEED direto no numpy.random

SEED = 42
numpy.random.seed(42)

Os algoritmos do scikit-learn utilizam o numpy para gerar os números aleatórios.

Bons Estudos, abraço.

: )