Solucionado (ver solução)
Solucionado
(ver solução)
2
respostas

Desbalanço nos dados

Sou a acostumado a ver ser realizado o processo de oversampling quando os dados são desbalanceados. Geralmente, com o objetivo de não viciar o modelo no sentido de dar muitos falsos negativos devido ao fato de haver muito mais "não-fraudes" do que "fraudes". O que fem com que o oversampling não fosse necessário?

2 respostas
solução!

Olá Jonathan, tudo bem? Espero que sim!

Você está correto Jonathan. Em conjuntos de dados em que a variável alvo é muito desbalanceada, é interessante aplicar técnicas de balanceamento de dados para obter resultados melhores.

É uma boa prática aplicar as técnicas e checar qual modelo se sai melhor com ou sem o uso da técnica.

A instrutora não fez o uso de nenhuma técnica e obteve um resultado razoável, porém você pode aplicar alguma técnica de balanceamento e verificar se o resultado é melhor.

Caso queira entender melhor o conceito de dados desbalanceados, pode checar o artigo: Lidando com o desbalanceamento de dados.

Bons estudos!

Ok, valeu!

Quer mergulhar em tecnologia e aprendizagem?

Receba a newsletter que o nosso CEO escreve pessoalmente, com insights do mercado de trabalho, ciência e desenvolvimento de software