Solucionado (ver solução)
Solucionado
(ver solução)
2
respostas

Relação aos dados Balanceados

Com o uso do SMOTE() deu para balancear os dados e melhorar o valor do recall, deixando-o próximo de 1 , mas tipo, ao usar o SMOTE() eu estou aumentando os dados para balancear, isso não seria ruim já que estou adicionando dados dentro do conjunto de dados, o que faz ele ter aquele desempenho bom? Não entendi isso de aumentar os dados do original para terem um melhor desempenho, ele não estaria forçando os dados originais a terem mais dados "fictícios"?

2 respostas
solução!

Olá!! tudo bem?

Entendo sua preocupação, Eduardo! É uma questão muito válida. Quando utilizamos técnicas como o SMOTE() para balancear os dados, de fato estamos introduzindo exemplos "fictícios" no conjunto de dados original. No entanto, isso não necessariamente é ruim. Na verdade, é uma forma de tentar ajudar o modelo a aprender melhor as características das classes minoritárias, o que pode melhorar o desempenho da classificação.

Ao aumentar os dados da classe minoritária de forma sintética, estamos fornecendo mais informações ao modelo sobre como essa classe se comporta no espaço de características. Isso pode ajudar a reduzir o viés do modelo em direção à classe majoritária, permitindo uma melhor generalização para novos exemplos.

Qualquer dúvida não hesite em perguntar! Bons estudos :)

Aaah, entendi ficou bem claro agora, muito obrigado :)