Olá pessoal!
Eu li dois tópicos referentes ao SEED passado por parâmetro random_state na função train_test_split e ainda não consegui entender o sentido desse parâmetro. Se alguém tiver paciência de me explicar eu agradeço.
Olá pessoal!
Eu li dois tópicos referentes ao SEED passado por parâmetro random_state na função train_test_split e ainda não consegui entender o sentido desse parâmetro. Se alguém tiver paciência de me explicar eu agradeço.
Olá Paulo, tudo bem ? Espero que sim.
O SEED vai ser usado pelo numpy para gerar um numero pseudoaleatório, e esse parâmetro é interesse para nos porque vamos poder reproduzir os nosso resultados, por exemplo no caso do train_test_split, se não utilizarmos o SEED teremos o dado separado de uma maneira diferente toda vez que rodarmos o nosso notebook, mantendo um SEED você pode reproduzir os mesmo resultados.
Então por exemplo, utilizando o mesmo SEED que o instrutor, você terá o mesmo resultado que ele teve. Além do train_test_split outros algoritmos no seu código podem usar a aleatoriedade dentro deles, se quiser garantir que todos os seus resultados possam ser reproduzidos, você pode atribuir o SEED direto no numpy.random
SEED = 42
numpy.random.seed(42)
Os algoritmos do scikit-learn utilizam o numpy para gerar os números aleatórios.
Bons Estudos, abraço.
: )