Olá, Gabriela! Tudo bem com você?
Desculpa pela demora em dar um retorno.
min_samples_split: É o número mínimo de amostras necessárias para dividir um nó interno, que na imagem enviada por você está representado por "Decision node". Em outras palavras podemos dizer que para realizar a divisão o nó deve ter pelo menos a quantidade definida em min_samples_split
. Se um nó tiver menos amostras que a quantidade definida pelo parâmetro min_samples_split
, ele não será dividido e o processo de divisão será finalizado para esse nó, os outros que se enquadrarem continuarão a ser divididos.
min_samples_leaf: É o número mínimo de amostras que deve existir em cada folha. Ao realizar uma divisão de um nó você acabará se deparando com a situação de ter 50 amostras em nó e 1 amostra em outro, isso não nos ajuda muito. Para evitar esse tipo de situação definimos um número mínimo de amostras que são permitidas em cada folha. Então se a divisão resultar em uma folha com menos amostras que a definida em min_samples_leaf
, o algoritmo não permitirá a divisão.
Qualquer dúvida estou à disposição.
Abraços.
Caso este post tenha lhe ajudado, por favor, marcar como solucionado ✓.Bons Estudos!