Solucionado (ver solução)
Solucionado
(ver solução)
2
respostas

Treino e teste na aula: Treinando e testando o algoritmo com metade dos dados

Fiquei em dúvida nessa parte, pois o Guilherme colocou o

treino_dados = X[:90]
treino_marcacoes = Y[:90]

e

teste_dados = X[-9:]
teste_marcacoes = Y[-9:]

Não seria ao contrário, o treino ficar com 9 e o teste com 90? Na minha cabeça o algorítmo teria que treinar com apenas esses poucos dados e depois no "mundão" que tem muito mais dados que é o teste, em que ele seria testado, viria esses dados em maior quantidade...

2 respostas
solução!

Olá Fagner,

O mais utilizado e recomendado é treinar com muitos dados, porque a partir do treino é que o modelo se aproxima da realidade e aumenda o nível de confiança. O teste só existe para confirmar/validar o resultado treino.

O normal é utilizar a divisão 80/20 de treino/teste (em porcentagem), mas como no exemplo são apenas 99 itens no total, o que pode ser considerado pouco treino para criar um modelo, o instrutor escolheu colocar uma porcentagem maior ainda para o treino, algo próximo de 90/10 de treino/teste.

Espero ter ajudado, se ainda tiver alguma dúvida é só falar.

Obrigado Lucas, entendi o ponto de porque o treino deve receber mais dados, vlw!!!

Quer mergulhar em tecnologia e aprendizagem?

Receba a newsletter que o nosso CEO escreve pessoalmente, com insights do mercado de trabalho, ciência e desenvolvimento de software