1
resposta

Estratificação com múltiplas condições.

Olá, minha duvidá é a seguinte: caso eu tenho que realizar uma estratificação tanto nas classes quanto nos dados como posso realizar esse procedimento, exemplo: Quero criar um modelo que preveja se o consumidor pagará para assistir um determinado video, ou ficará somente na versão trial, em estudos percebemos que homens e mulheres tem comportamento diferentes, quero que alem de levar em consideração os labels: Pagaram ou não, estratificar também com: São homens ou são mulheres.

1 resposta

Olá, Eugênio! Tudo bem com você?

Primeiramente gostaria de pedir desculpas pela demora em te retornar.

A abordagem com a estratificação é utilizada para preservar a proporção da distribuição dos rótulos dentro do conjunto de treino e teste com k dobras, para não cair numa condição de seus dados serem treinados com todos os rótulos iguais a 1 e quando for testar serem passados rótulos iguais a 0, por exemplo.

Acontece que se você tem mais de uma variável com a qual você deseja realizar essa estratificação, não fica claro como essa amostragem pode ou deve ser estratificada para manter tal proporção, pois não há apenas uma variável. Nesse outro tópico é explicado com mais detalhes o funcionamento do StratifiedKFold.

Uma alternativa diferente da estratificação com múltiplas variáveis, pode ser a utilização do StratifiedGroupKFold que tenta criar as dobras mantendo a porcentagem das amostras em cada rótulo, como o StratifiedKFold, porém com a restrição de grupos, semelhante ao GroupKFold. Nesse outro tópico é explicado com mais detalhes como funciona o GroupKFold. Na documentação há um exemplo de utilização que você pode está conferindo com mais detalhes. Dê uma olhada e veja se esse método se encaixa no seu problema.

Caso você tenha curiosidade deixo como sugestão esse artigo que fornece maiores detalhes sobre a estratificação com mais de um rótulo. Infelizmente o artigo está em inglês, então caso você não possua familiaridade com o idioma sugiro utilizar um tradutor no navegador que ajudará.

Espero ter ajudado, mas se ainda persistir alguma dúvida estou sempre à disposição.

:)

Caso este post tenha lhe ajudado, por favor, marcar como solucionado ✓.Bons Estudos!

Quer mergulhar em tecnologia e aprendizagem?

Receba a newsletter que o nosso CEO escreve pessoalmente, com insights do mercado de trabalho, ciência e desenvolvimento de software