Dúvida - necessidade ou não de padronizar os dados por "StandardScaler" | Regressão linear: testando relações e prevendo resultados

Marcos André Nohatto · 2024-03-23 10:57

surgiu uma dúvida. Estava vendo um outro vídeo antes de realizar esse curso também na área de regressão. Antes de construir o modelo, o professor daquele vídeo falou sobre padronizar os dados de x (

Dúvida - necessidade ou não de padronizar os dados por "StandardScaler"

Olá, Marcos.

Tudo bem?

Sua pergunta é muito relevante. A padronização dos dados, que é o processo de transformar os dados para que eles tenham média zero e desvio padrão um, é uma etapa importante em muitos algoritmos de machine learning. Isso ocorre porque muitos algoritmos são sensíveis à escala dos dados. Por exemplo, se uma variável explicativa varia de 0 a 1 e outra varia de 1 a 1000, o algoritmo pode dar mais importância à segunda variável simplesmente por causa de sua escala, mesmo que a primeira variável seja mais importante para o problema em questão.

No entanto, em relação à regressão linear, a padronização dos dados não é estritamente necessária. A regressão linear não é sensível à escala dos dados, e você pode obter os mesmos resultados com dados padronizados ou não padronizados. A diferença é que, se você padronizar os dados, os coeficientes da regressão serão em termos de desvios padrão, o que pode ser mais fácil de interpretar.

Portanto, a resposta para sua pergunta é: não, não é estritamente necessário padronizar os dados para construir um modelo de regressão linear. No entanto, pode ser útil fazê-lo por razões de interpretabilidade.

Espero ter ajudado. Qualquer dúvida manda aqui. Bons estudos.

Importante

Dúvida - necessidade ou não de padronizar os dados por "StandardScaler"

Trilhas por carreira

Carreiras de IA

Carreiras de Dados

Carreiras de Cyber

Carreiras de DevOps & Cloud

Carreiras de UX & UI

Carreiras de Mobile & Front-End

Carreiras de Back-End

Carreiras de Negócios

Cursos universitários FIAP