Olá boa tarde! Venho de uma sequência de estudos na formação de Machine Learn e anteriormente foi apresentado o parâmetro stratify
do método train_test_split
da biblioteca sklearn
nos seus módulos de model_selection
, o conceito apresentado de oversampling (ou undersampling) é para que não fiquemos "reféns" dos argumentos da bibliotecas? Outra questão, existe alguma relação entre os dois conceitos Stratification e Oversampling?