1
resposta

Uso do state_random

Como usamos o state_random=2811 para fins didáticos na criação dos datasets de treino e teste para ambos os modelos (com temp_max e temp_media), os datasets foram criados com exatamente os mesmo dados, mudando apenas a coluna da temperatura, correto? Mas no caso de não usarmos, uma combinação diferente seria formada. Isso influencia alguma coisa na comparação dos modelos?

1 resposta

Oi, Mariana! tudo bem?

Sim, você está certa! Ao utilizar o parâmetro random_state=2811 para a divisão dos dados em conjuntos de treino e teste, você garante que os conjuntos de dados de treino e teste serão os mesmos em cada execução do seu código.

Se você não utilizar o parâmetro random_state, diferentes combinações de dados serão usadas para treinar e testar seus modelos em cada execução do seu código. Isso pode afetar a precisão das suas avaliações, pois as métricas de avaliação podem ser diferentes em cada situação.

Quer mergulhar em tecnologia e aprendizagem?

Receba a newsletter que o nosso CEO escreve pessoalmente, com insights do mercado de trabalho, ciência e desenvolvimento de software