1
resposta

k-fold

Olá, quando k=10 e tenho 5000 dados para treino e teste. Qual a porcentagem de treino e teste? Pois como tenho muito elementos ele poderia quebrar em 2 para treino e 4998 para teste. Entende? Ou seja, como sei que ele está fazendo as melhores quebras e tem como saber como ele dividiu...?

Garanta sua matrícula hoje e ganhe + 2 meses grátis

Continue sua jornada tech com ainda mais tempo para aprender e evoluir

Quero aproveitar agora
1 resposta

Oi Rafael,

No k-fold o que se faz é dividir suas amostras em k grupos de mesmo tamanho e utilizar k-1 grupos para treino e o que sobrou para teste.

No caso como k = 10 e há 5000 amostras, serão 10 grupos de tamanho 500, logo 4500 amostras para treino e 500 para teste.

Sobre a divisão que ele faz, não tenho certeza mas imagino que seja os 500 primeiros para teste na primeira rodada, depois os próximos 500, etc.