porque no exemplo da criação do SEED se colocou o valor 20? se colocar outros valores que diferenças teríamos?
porque no exemplo da criação do SEED se colocou o valor 20? se colocar outros valores que diferenças teríamos?
Olá Carlos,
Como explicado na aula o retorno de train_test_split
mistura/embaralha os dados antes de separar, e o SEED
funciona como um valor base para definir como que vai ser feito esse embaralhamento. Normalmente é gerado um valor aleatório para o SEED
e por isso temos os resultados diferentes cada vez que executamos o train_test_split
, já que cada SEED
diferente vai resultar em um embaralhamento diferente.
Assim podemos passar um valor fixo para o SEED
e então obter sempre o mesmo resultado no train_test_split
, e esse valor pode ser qualquer um que você quiser. O professor apenas quis utilizar 20 e pronto, sem mais nenhum motivo maior.
E modificando o valor de SEED
vamos receber uma variação diferente no resultado do train_test_split
para cada SEED
diferente, como explicado acima.
Espero ter ajudado, se ainda tiver alguma dúvida é só falar!