não ficou tão claro a utilidade do Pipeline e o groupKfold eu não entendi para que serve de fato
não ficou tão claro a utilidade do Pipeline e o groupKfold eu não entendi para que serve de fato
Olá Naoki, tudo bem ? Espero que sim.
Desculpa pela demora no retorno.
Pela documentação vemos que o Pipeline é utilizado para criar uma sequencia de etapas de transformação que você quer sejam aplicadas no seu dado antes de treinar o modelo, um exemplo de transformação é o StandardScaler.
Já o GroupKFold é usado para separar seus dados em grupos que serão usados em treinamentos, essa etapa é importante quando você fazer o cross validation, porque quer seu dados separados de maneira diferentes.
Espero ter ajudado, mas caso ainda não tenha ficado claro pode avisar, que procuro outra maneira de explicar.
Bons estudos, abraço.