Solucionado (ver solução)
Solucionado
(ver solução)
2
respostas

Como passar o conjunto de treino e teste no parametro cv do GridSearchCV?

O conjunto de dados que estou usando tem relacionamento temporal e por isso não gostaria de usar kfold ou shuffle nos dados. Segmentei uma parte inicial para validacao e o restante gostaria de passar o dataset já segmentando em treino e teste mas na documentação do GridSerachCV não explica como.

2 respostas
solução!

Olá Jean.

Como você está?

Você pode utilizar essas duas técnicas e depois passá-las para o parâmetro cv:

PredefinedSplit() - Documentação Predefinedplit

Em que pode-se usar este dataset já segmentado (pré-definido).

ou

TimesSeriesSplit() - Documentação TimesSeriesSplit

Uma abordagem semelhante ao K-fold, porém ele respeita os intervalos de tempo sequenciais do conjunto.

Espero ter ajudado! Quaisquer dúvidas que persistirem fico a disposição!

Bons estudos :)

Obrigado Ana! Eu havia usado o TimesSeriesSplit() mas não conhecia a técnica PredefinedSplit(). Problema resolvido!!

Quer mergulhar em tecnologia e aprendizagem?

Receba a newsletter que o nosso CEO escreve pessoalmente, com insights do mercado de trabalho, ciência e desenvolvimento de software