Olá pessoal!
Eu li dois tópicos referentes ao SEED passado por parâmetro random_state na função train_test_split e ainda não consegui entender o sentido desse parâmetro. Se alguém tiver paciência de me explicar eu agradeço.
Você está vendo a versão anterior da nova experiência da Alura que estamos preparando para você. Em breve, ela ganha uma identidade visual novinha totalmente pensada em potencializar seus estudos!
Olá pessoal!
Eu li dois tópicos referentes ao SEED passado por parâmetro random_state na função train_test_split e ainda não consegui entender o sentido desse parâmetro. Se alguém tiver paciência de me explicar eu agradeço.
Olá Paulo, tudo bem ? Espero que sim.
O SEED vai ser usado pelo numpy para gerar um numero pseudoaleatório, e esse parâmetro é interesse para nos porque vamos poder reproduzir os nosso resultados, por exemplo no caso do train_test_split, se não utilizarmos o SEED teremos o dado separado de uma maneira diferente toda vez que rodarmos o nosso notebook, mantendo um SEED você pode reproduzir os mesmo resultados.
Então por exemplo, utilizando o mesmo SEED que o instrutor, você terá o mesmo resultado que ele teve. Além do train_test_split outros algoritmos no seu código podem usar a aleatoriedade dentro deles, se quiser garantir que todos os seus resultados possam ser reproduzidos, você pode atribuir o SEED direto no numpy.random
SEED = 42
numpy.random.seed(42)Os algoritmos do scikit-learn utilizam o numpy para gerar os números aleatórios.
Bons Estudos, abraço.
: )