Qual o motivo de não está sendo usado o test_size?
Qual o motivo de não está sendo usado o test_size?
Olá, William, tudo bem?
Na aula, o foco está em demonstrar a aplicação de diferentes modelos de classificação e como preparar os dados para obter melhores resultados. O test_size
é um parâmetro importante para definir a proporção de dados que serão usados para teste, mas, neste caso, o tamanho do conjunto de teste é definido implicitamente pela função train_test_split
ao não especificar o test_size
, que usa o padrão de 25% para teste e 75% para treino.
O instrutor optou por focar na comparação entre os modelos SVC
e LinearSVC
, na importância do escalonamento dos dados com o StandardScaler
e na análise da acurácia dos modelos.
Se você quiser explorar o uso do test_size
, pode adicioná-lo ao código para controlar a divisão dos dados de forma mais explícita. Por exemplo, test_size=0.2
para usar 20% dos dados para teste e 80% para treino.
Experimente modificar o valor do test_size
e observe como isso afeta a acurácia dos modelos. Essa é uma boa forma de entender melhor o impacto desse parâmetro no desempenho do seu modelo.
Espero ter ajudado.
Qualquer dúvida que surgir, compartilhe no fórum. Abraços e bons estudos!