3
respostas

[Dúvida] test_size

Qual o motivo de não está sendo usado o test_size?

3 respostas

Olá, William, tudo bem?

Na aula, o foco está em demonstrar a aplicação de diferentes modelos de classificação e como preparar os dados para obter melhores resultados. O test_size é um parâmetro importante para definir a proporção de dados que serão usados para teste, mas, neste caso, o tamanho do conjunto de teste é definido implicitamente pela função train_test_split ao não especificar o test_size, que usa o padrão de 25% para teste e 75% para treino.

O instrutor optou por focar na comparação entre os modelos SVC e LinearSVC, na importância do escalonamento dos dados com o StandardScaler e na análise da acurácia dos modelos.

Se você quiser explorar o uso do test_size, pode adicioná-lo ao código para controlar a divisão dos dados de forma mais explícita. Por exemplo, test_size=0.2 para usar 20% dos dados para teste e 80% para treino.

Experimente modificar o valor do test_size e observe como isso afeta a acurácia dos modelos. Essa é uma boa forma de entender melhor o impacto desse parâmetro no desempenho do seu modelo.

Espero ter ajudado.

Qualquer dúvida que surgir, compartilhe no fórum. Abraços e bons estudos!

Caso este post tenha lhe ajudado, por favor, marcar como solucionado ✓. Bons Estudos!

tem algum curso ou formação que aborde o test_size?

Oi, William!
Desculpe o aguardo.

No curso Classificação: otimizando modelos de machine learning, o instrutor utiliza o parâmetro test_size logo na primeira aula.

Mas a minha sugestão é que você dê uma olhada na documentação oficial do train_test_split e experimente diferentes valores para o test_size. Assim, você consegue observar como essa variação impacta o comportamento do modelo na prática.

Fico à disposição.