1
resposta

sobre normalização

Não entendi o que é normalização, quando fazer, como fazer e por que fazer. Poderia me explicar, por favor? Obrigado!

1 resposta

Oi Pietro! Bora para mais uma!

Normalização:

Quando tratamos de normalização em Data Science, estamos falando sobre ajustes necessários em nossos dados para que possamos obter os resultados de forma mais precisa, sem ruídos ou interferências, os outliers, que acabem gerando uma análise equivocada.

Ela se faz necessário para que seu algoritmo não fique enviesado para as variáveis com maior ordem de grandeza, ou seja, com pesos distintos entre elas, fazendo seu algoritmo escolher de forma errada. As variáveis podem ser normalizadas segundo a amplitude ou segundo a distribuição. Lembrando que é necessário uma análise prévia da sua base de dados e regra de negócio, para que você perceba se é necessário trazer essa normalização ou se as diferenças existentes precisam ser mantidas.

Como exemplo eu deixarei um pdf para que você possa ter um acesso melhor sobre a aplicação, por que entra notação matemática e é difícel de escrever aqui por conta disso. Segue o Documento. A informação encontra-se na página 10 e o assunto da página inicia em 3.7.3. Normalização de atributos numéricos

Deixarei também este outro pdf que conta com duas formas distintas para normalização na página 32 com o assunto Normalização. Segue o Documento

Espero ter te ajudado mais uma vez e obrigado pelo empenho!