Solucionado (ver solução)
Solucionado
(ver solução)
1
resposta

Composição de dados para treino e para teste

EDIT: Avançando no curso, vi que no tópico seguinte o assunto era abordado.

Bom dia, tudo bem?

Foi apresentado o conjunto de dados para treino como sendo os primeiros 75 valores do nosso dataset dados, gostaria de saber se não seria mais útil ou aconselhado escolher de forma aleatória esses 75 valores?

dessa forma: X_train, X_test, y_train, y_test = train_test_split( X, y, test_size=0.25, random_state=42)

1 resposta
solução!

Olá, Douglas! Tudo bem com você?

A melhor estratégia para treinarmos nossos modelos de machine learning é colocar os dados de forma aleatória, dessa forma eliminariamos algum viés que os primeiros dados poderiam ter, por exemplo.

Qualquer dúvida estou à disposição.

Quer mergulhar em tecnologia e aprendizagem?

Receba a newsletter que o nosso CEO escreve pessoalmente, com insights do mercado de trabalho, ciência e desenvolvimento de software