1
resposta

k-fold

Olá, quando k=10 e tenho 5000 dados para treino e teste. Qual a porcentagem de treino e teste? Pois como tenho muito elementos ele poderia quebrar em 2 para treino e 4998 para teste. Entende? Ou seja, como sei que ele está fazendo as melhores quebras e tem como saber como ele dividiu...?

1 resposta

Oi Rafael,

No k-fold o que se faz é dividir suas amostras em k grupos de mesmo tamanho e utilizar k-1 grupos para treino e o que sobrou para teste.

No caso como k = 10 e há 5000 amostras, serão 10 grupos de tamanho 500, logo 4500 amostras para treino e 500 para teste.

Sobre a divisão que ele faz, não tenho certeza mas imagino que seja os 500 primeiros para teste na primeira rodada, depois os próximos 500, etc.

Quer mergulhar em tecnologia e aprendizagem?

Receba a newsletter que o nosso CEO escreve pessoalmente, com insights do mercado de trabalho, ciência e desenvolvimento de software