1
resposta

[Dúvida] Sobre o NearMiss

Como apresentado no saiba mais, o NearMiss escolhe os dados que serão mantidos com base distância correto? Então para auxiliar no processo de balanceamento podemos aplicar uma normalização nos dados antes de aplicarmos o NearMiss? Obrigado pela atenção!

1 resposta

Oii, Cauê, tudo bem?

Sim, você está certinho. O algoritmo NearMiss seleciona os dados com base na distância entre eles (por isso o nome! Hehe). Agora, em relação à sua pergunta sobre a normalização dos dados antes de aplicar o NearMiss, a resposta é: depende.

A normalização dos dados é uma técnica utilizada para colocar todas as variáveis na mesma escala, geralmente entre 0 e 1. Isso pode ser útil quando temos variáveis com unidades de medida diferentes ou com uma grande variação nos valores.

No caso do NearMiss, se as suas variáveis já estão na mesma escala (ou se a diferença de escala entre elas não é um problema para o seu modelo), você não precisa normalizar os dados. No entanto, se as suas variáveis estão em escalas bem diferentes, a normalização pode ajudar com toda certeza.

Se outra dúvida surgir, estamos por aqui!

Abraços.

Caso este post tenha lhe ajudado, por favor, marcar como solucionado ✓.

Quer mergulhar em tecnologia e aprendizagem?

Receba a newsletter que o nosso CEO escreve pessoalmente, com insights do mercado de trabalho, ciência e desenvolvimento de software