Existe alguma proporção ideal, ótima ou típica para estabelecer a divisão do dataset em subconjuntos de treino e testes?
Existe alguma proporção ideal, ótima ou típica para estabelecer a divisão do dataset em subconjuntos de treino e testes?
Oii Peter, tudo certinho por ai?
Na comunidade científica é muito comum encontrarmos uma divisão de 70/30, ou seja 70% dos dados para treino e 30% para testes, mas não é algo engessado, tanto que você pode fazer 80% de treino e 20% de testes ou 75% de treino e 25% de testes, fica a seu critério.
Qualquer outra dúvida, é so chamar, ok?
Bons estudos ^^
Oiê Sthephanie!
70/30 como uma divisão "prática", com liberdade para variar a proporção acima e abaixo conforme a situação! Legal! Era isso mesmo que eu queria confirmar!
Muito obrigado pela sua (rápida) resposta!
Até mais! :D