Qual a logica do 0.2?
Qual a logica do 0.2?
Oi Clara, tudo bem?
O objetivo é separar os dados em um conjunto de treino e um conjunto de teste. E esse valor representa a proporção do conjunto de dados que será reservada para teste. No caso de 0.2, isso significa que 20% dos dados serão usados para teste, enquanto os 80% restantes serão usados para treino. Por exemplo, se você tem um dataset com 500 amostras, ao definir test_size=0.2
, o train_test_split
vai separar 100 amostras para o conjunto de teste e 400 amostras para o conjunto de treino.
Essa divisão é importante para poder avaliar o desempenho do modelo treinado. O conjunto de teste serve para testar o modelo e ver como ele se comporta com dados que ele não viu durante o treinamento. E o valor 20% para teste é comum, pois permite ter um conjunto de teste significativo, sem comprometer muito o tamanho do conjunto de treino.
Espero ter esclarecido.
Qualquer dúvida, compartilhe no fórum.
Abraços e bons estudos!