Solucionado (ver solução)
Solucionado
(ver solução)
2
respostas

É normal o gráfico ser diferente da aula?

Pelo que entendi, o teste é feito usando 30% como amostra e esses 30% são aleatórios. Então o meu gráfico gerado, será diferente da aula, que será diferente de outra pessoa fazendo. Ou seja, é normal o ser diferente e não tem nenhum erro em meu código causando isso? Print do meu gráfico: https://imgur.com/t6ax6Aq

2 respostas
solução!

Olá Rafael,

Dentro do método train_test_split existe um parâmetro chamado random_state, que serve para fixar o critério de aleatoriedade do algoritmo.

Veja o exemplo:

train_test_split( X, y, test_size=0.33, random_state=42)

Respondendo sua pergunta: Se você não fixar o parâmetro de random_state, é normal que a cada execução, novos conjuntos amostrais sejam definidos e você obtenham resultados parecidos, mas não idênticos.

Minha opinião: Em um empresa ou estudo científico, onde os resultados precisam ser replicáveis para facilitar o processo de auditoria, é interessante setar o random_state, para que o resultado gerado nas validações do trabalho sejam iguais ao apresentado no desenvolvimento.

Abs

Muito obrigado pela resposta! Muito completa, explicativa e indo além!! Obrigado Abraço!

Quer mergulhar em tecnologia e aprendizagem?

Receba a newsletter que o nosso CEO escreve pessoalmente, com insights do mercado de trabalho, ciência e desenvolvimento de software