Olá, Eugênio! Tudo bem com você?
Primeiramente gostaria de pedir desculpas pela demora em te retornar.
A abordagem com a estratificação é utilizada para preservar a proporção da distribuição dos rótulos dentro do conjunto de treino e teste com k dobras, para não cair numa condição de seus dados serem treinados com todos os rótulos iguais a 1 e quando for testar serem passados rótulos iguais a 0, por exemplo.
Acontece que se você tem mais de uma variável com a qual você deseja realizar essa estratificação, não fica claro como essa amostragem pode ou deve ser estratificada para manter tal proporção, pois não há apenas uma variável. Nesse outro tópico é explicado com mais detalhes o funcionamento do StratifiedKFold.
Uma alternativa diferente da estratificação com múltiplas variáveis, pode ser a utilização do StratifiedGroupKFold que tenta criar as dobras mantendo a porcentagem das amostras em cada rótulo, como o StratifiedKFold, porém com a restrição de grupos, semelhante ao GroupKFold. Nesse outro tópico é explicado com mais detalhes como funciona o GroupKFold. Na documentação há um exemplo de utilização que você pode está conferindo com mais detalhes. Dê uma olhada e veja se esse método se encaixa no seu problema.
Caso você tenha curiosidade deixo como sugestão esse artigo que fornece maiores detalhes sobre a estratificação com mais de um rótulo. Infelizmente o artigo está em inglês, então caso você não possua familiaridade com o idioma sugiro utilizar um tradutor no navegador que ajudará.
Espero ter ajudado, mas se ainda persistir alguma dúvida estou sempre à disposição.
:)
Caso este post tenha lhe ajudado, por favor, marcar como solucionado ✓.Bons Estudos!