Qual o motivo de não está sendo usado o test_size?
Qual o motivo de não está sendo usado o test_size?
Olá, William, tudo bem?
Na aula, o foco está em demonstrar a aplicação de diferentes modelos de classificação e como preparar os dados para obter melhores resultados. O test_size é um parâmetro importante para definir a proporção de dados que serão usados para teste, mas, neste caso, o tamanho do conjunto de teste é definido implicitamente pela função train_test_split ao não especificar o test_size, que usa o padrão de 25% para teste e 75% para treino.
O instrutor optou por focar na comparação entre os modelos SVC e LinearSVC, na importância do escalonamento dos dados com o StandardScaler e na análise da acurácia dos modelos.
Se você quiser explorar o uso do test_size, pode adicioná-lo ao código para controlar a divisão dos dados de forma mais explícita. Por exemplo, test_size=0.2 para usar 20% dos dados para teste e 80% para treino.
Experimente modificar o valor do test_size e observe como isso afeta a acurácia dos modelos. Essa é uma boa forma de entender melhor o impacto desse parâmetro no desempenho do seu modelo.
Espero ter ajudado.
Qualquer dúvida que surgir, compartilhe no fórum. Abraços e bons estudos!
tem algum curso ou formação que aborde o test_size?
Oi, William!
Desculpe o aguardo.
No curso Classificação: otimizando modelos de machine learning, o instrutor utiliza o parâmetro test_size logo na primeira aula.
Mas a minha sugestão é que você dê uma olhada na documentação oficial do train_test_split e experimente diferentes valores para o test_size. Assim, você consegue observar como essa variação impacta o comportamento do modelo na prática.
Fico à disposição.