Solucionado (ver solução)
Solucionado
(ver solução)
2
respostas

oversampling/undersampling

Olá, quando podemos considerar os dados desbalanceados? Existe algum critério ou método para se avaliar a necessidade de aplicação o oversampling/undersampling?

2 respostas
solução!

Olá, Fabricio! Tudo bem com você?

Segundo a publicação "Imbalanced Data" no site Google Developers, temos que:

Grau de desequilíbrioProporção da Classe Minoritária
Suave20-40% do conjunto de dados
Moderado1-20% do conjunto de dados
Extremo<1% do conjunto de dados

Lembrando que:

Classes majoritárias: Classe que está em maior quantidade na feature target.

Classes minoritária: Classe que está em menor quantidade na feature target.

Qualquer dúvida estou à disposição.

Abraços.

Caso este post tenha lhe ajudado, por favor, marcar como solucionado ✓.Bons Estudos!

Mais claro impossível, muito obrigado!!!