1
resposta

Pré processamento para machine learning

Fala galera!

Preciso de uma ajuda com uma dúvida de padronização/normalização para modelos.

Tenho um dataset com variáveis em escalas diferentes, onde se faz necessário realizar o standardization. Até aí tudo bem.

A dúvida é: quando entrarem novos dados para a predição, eles não estarão padronizados com média em 0 e std em 1. Estes novos dados precisarão passar pelo processo também? E se sim, este pré-processamento pode ter resultados diferentes dependendo da amostra utilizada, certo?

Obrigado desde já!

1 resposta

Olá Diogo tudo bem com você??

Você está corretíssimo! Os novos dados precisarão passar pelo processo de std tbm e dependendo da amostra os resultados serão influenciados, como você supôs.

Espero ter te ajudado e qualquer dúvida é só retornar aqui!

Bons estudos!