Existe alguma proporção ideal, ótima ou típica para estabelecer a divisão do dataset em subconjuntos de treino e testes?
Você está vendo a versão anterior da nova experiência da Alura que estamos preparando para você. Em breve, ela ganha uma identidade visual novinha totalmente pensada em potencializar seus estudos!
Existe alguma proporção ideal, ótima ou típica para estabelecer a divisão do dataset em subconjuntos de treino e testes?
Oii Peter, tudo certinho por ai?
Na comunidade científica é muito comum encontrarmos uma divisão de 70/30, ou seja 70% dos dados para treino e 30% para testes, mas não é algo engessado, tanto que você pode fazer 80% de treino e 20% de testes ou 75% de treino e 25% de testes, fica a seu critério.
Qualquer outra dúvida, é so chamar, ok?
Bons estudos ^^
Oiê Sthephanie!
70/30 como uma divisão "prática", com liberdade para variar a proporção acima e abaixo conforme a situação! Legal! Era isso mesmo que eu queria confirmar!
Muito obrigado pela sua (rápida) resposta!
Até mais! :D