Oii, Cauê, tudo bem?
Sim, você está certinho. O algoritmo NearMiss seleciona os dados com base na distância entre eles (por isso o nome! Hehe). Agora, em relação à sua pergunta sobre a normalização dos dados antes de aplicar o NearMiss, a resposta é: depende.
A normalização dos dados é uma técnica utilizada para colocar todas as variáveis na mesma escala, geralmente entre 0 e 1. Isso pode ser útil quando temos variáveis com unidades de medida diferentes ou com uma grande variação nos valores.
No caso do NearMiss, se as suas variáveis já estão na mesma escala (ou se a diferença de escala entre elas não é um problema para o seu modelo), você não precisa normalizar os dados. No entanto, se as suas variáveis estão em escalas bem diferentes, a normalização pode ajudar com toda certeza.
Se outra dúvida surgir, estamos por aqui!
Abraços.
Caso este post tenha lhe ajudado, por favor, marcar como solucionado ✓.