1
resposta

[Dúvida] Parte 4 do Desafio

Eu queria saber, qual o motivo de os dados de teste, terem ficado menores que os de validação?

Insira aqui a descrição dessa imagem para ajudar na acessibilidade

1 resposta

Olá, William! Como vai?

A diferença no tamanho entre os dados de teste e os de validação pode ocorrer por alguns motivos comuns:

  1. Proporção de Divisão: Normalmente, os dados são divididos em conjuntos de treino, validação e teste. Se a divisão foi feita de forma a priorizar mais dados para treino e validação, o conjunto de teste pode acabar sendo menor.

  2. Estratégia de Validação Cruzada: Durante a validação cruzada, o conjunto de dados é dividido em várias partes para garantir que o modelo seja testado em diferentes subconjuntos. Isso pode fazer parecer que o conjunto de validação é maior, pois ele é usado repetidamente em diferentes iterações.

  3. Objetivo do Teste: O conjunto de teste é geralmente menor porque seu objetivo principal é fornecer uma avaliação final do modelo após ele ter sido treinado e ajustado. Assim, não precisa ser tão grande quanto o conjunto de treino ou de validação.

Se você estiver usando uma função como train_test_split do Scikit-learn, pode ajustar o parâmetro test_size para controlar o tamanho do conjunto de teste.

Espero ter ajudado e fico à disposição se precisar.

Abraço e bons estudos!

Caso este post tenha lhe ajudado, por favor, marcar como solucionado