Solucionado (ver solução)
Solucionado
(ver solução)
1
resposta

min_samples_split e min_samples_leaf

Alguém pode me explicar a diferença entre eles ? o professor explica mas não ficou claro pra mim ainda.

O min_samples_leaf é o número mínimo de samples no nó final da folha

min_samples_split seria a quebra no meio da árvore

É assim como está na imagem ? em verde entraria o hiperparâmetro min_samples_split e em azul o hiperparâmetro min_samples_leaf ?

Insira aqui a descrição dessa imagem para ajudar na acessibilidade

1 resposta
solução!

Olá, Gabriela! Tudo bem com você?

Desculpa pela demora em dar um retorno.

min_samples_split: É o número mínimo de amostras necessárias para dividir um nó interno, que na imagem enviada por você está representado por "Decision node". Em outras palavras podemos dizer que para realizar a divisão o nó deve ter pelo menos a quantidade definida em min_samples_split. Se um nó tiver menos amostras que a quantidade definida pelo parâmetro min_samples_split, ele não será dividido e o processo de divisão será finalizado para esse nó, os outros que se enquadrarem continuarão a ser divididos.

min_samples_leaf: É o número mínimo de amostras que deve existir em cada folha. Ao realizar uma divisão de um nó você acabará se deparando com a situação de ter 50 amostras em nó e 1 amostra em outro, isso não nos ajuda muito. Para evitar esse tipo de situação definimos um número mínimo de amostras que são permitidas em cada folha. Então se a divisão resultar em uma folha com menos amostras que a definida em min_samples_leaf, o algoritmo não permitirá a divisão.

Qualquer dúvida estou à disposição.

Abraços.

Caso este post tenha lhe ajudado, por favor, marcar como solucionado ✓.Bons Estudos!

Quer mergulhar em tecnologia e aprendizagem?

Receba a newsletter que o nosso CEO escreve pessoalmente, com insights do mercado de trabalho, ciência e desenvolvimento de software