1
resposta

[Dúvida] Pesos x generalização dos dados.

Olá,

Estou com um projeto que preciso otimizar os hiperparâmetro e um problema de multiclasses e como no mundo real estão desbalanceadas, no entanto ao executar um cross validate com e sem SMOTE, as métricas são muito próximas, então pensei em testar com pesos. A questão é se o dados da classe for deficiente em generalização então trabalhar com pesos não teria um ganho nos resultados. Neste caso é melhor buscar mais dados que o modelo de fato entenda ou posso ter ganhos com pesos indicando ao modelo treinar mais na classe deficitária?

Trata-se de uma base de dados de ataques DDOS, temos 6 classes uma delas é acesso normal e as outras são ataques, e um dessas classes o modelo nãp consegue aprender muito, o modelo já estar overffitando com as outras e não generaliza nessa.

1 resposta

Oi, Luiz. Como vai?

Entendo. Parece que você está passando por um desafio! Muitas vezes, é necessário tentativa e erro para encontrar a melhor abordagem - a jornada de aprimorar modelos precisa de persistência e experimentação de diferentes estratégias.

Considerando que você já tentou algumas estratégias e não viu muita melhoria nas métricas de desempenho, pode ser que o problema não esteja totalmente na distribuição dos dados ou nos pesos atribuídos. Pode ser que o modelo esteja com overfitting para as outras classes, o que dificultaria sua capacidade de generalizar para a classe problemática. Sendo esse o caso, sugeriria explorar mais a fundo os dados da classe problemática e ajustar outros hiperparâmetros do modelo, como complexidade ou algoritmo.

Espero ter te dado uma luz, Luiz! Desejo sucesso.

Abraços.

Caso este post tenha lhe ajudado, por favor, marcar como solucionado ✓. Bons Estudos!