Não entendi a necessidade de usar o scaler no pipeline

Importante

Você está vendo a versão anterior da nova experiência da Alura que estamos preparando para você. Em breve, ela ganha uma identidade visual novinha totalmente pensada em potencializar seus estudos!

1
resposta

por Estudante

| 295.5k xp | 3 posts

bom dia,

Estava vendo a aula que trata do pipeline no sklearn e não entendi essa parte. Não entendi porque não se pode simplesmente pegar o conjunto todo de dados, não apenas o de treino , mais o de treino e teste de treino juntos, escalar e depois usar o cross validate. Não entendi a necessidade de se reescalar os dados em cada etapa do cross validate.

1 resposta

por Raul Saraiva Bezerra

| 250k xp | 16 posts

30/01/2022

Pelo q entendi, se vc escalar td e dps dividir, vc ta usando dados q teoricamente seriam desconhecidos para fazer seus parâmetros de escalonamento e isso é errado. O escalamento mais real é oq vc só usa os dados de treino e reescala os de teste com base no scaler de treino.

Ou é isso q eu entendi pelo menos, to fazendo o curso agr tbm xD

Importante

Trilhas por carreira

Carreiras de IA

Carreiras de Dados

Carreiras de Cyber

Carreiras de DevOps & Cloud

Carreiras de UX & UI

Carreiras de Mobile & Front-End

Carreiras de Back-End

Carreiras de Negócios

Cursos universitários FIAP

Importante

Tópicos relacionados

Conteúdos Alura com o tema

Trilhas por carreira

Carreiras de IA

Carreiras de Dados

Carreiras de Cyber

Carreiras de DevOps & Cloud

Carreiras de UX & UI

Carreiras de Mobile & Front-End

Carreiras de Back-End

Carreiras de Negócios

Cursos universitários FIAP