Bom dia, em geral está tudo certo no código, somente gostaria de saber uma coisa, quando usamos o pipeline o "cv_resultado" começa a variar? Pois o meu começou a variar ao usa-lo, mesmo com o uso do random_state. Obrigado pela atenção!
Bom dia, em geral está tudo certo no código, somente gostaria de saber uma coisa, quando usamos o pipeline o "cv_resultado" começa a variar? Pois o meu começou a variar ao usa-lo, mesmo com o uso do random_state. Obrigado pela atenção!
Oii Cauê, como vai?
É normal acontecerem pequenas variações no resultado do pipeline, sim, pode ficar tranquilo! Mesmo com o random state definido, o pipeline é uma sequência de operações que acontece por baixo dos panos, e, como no oversampling as amostras são geradas de forma aleatória, isso resulta em diferentes conjuntos de dados de treinamento em cada iteração da validação cruzada.
Assim, cada divisão do conjunto de dados para a validação cruzada pode resultar em diferentes conjuntos de treinamento e validação, o que também pode levar a variações nos resultados.
Se a variação for consistente - ou seja, se é pequena e se mantém num padrão muito próximo ao longo de várias execuções, podemos confiar no modelo.
Espero ter esclarecido sua dúvida, Cauê! Fico à disposição.
Abração.