Para que serviu o shuffle se ainda é determinístico?

Importante

Você está vendo a versão anterior da nova experiência da Alura que estamos preparando para você. Em breve, ela ganha uma identidade visual novinha totalmente pensada em potencializar seus estudos!

1
resposta

Referente ao curso Machine Learning: validação de modelos, no capítulo KFold e aleatoriedade e atividade Kfold com aleatorização

por Pedro Heck Rodrigues Costa

| 92.8k xp | 73 posts

Pelo que eu entendi, a ideia de usar o KFold era fazer uso do seu parâmetro "shuffle" afim de introduzir aleatoriedade no cross_validate(). No entanto, se o shuffle é determinístico, para que o estamos usando? Não entendi muito bem.

Obrigado!

1 resposta

por João Vitor de Miranda

| 1503.1k xp | 1891 posts

Instrutor

28/07/2022

Olá Pedro, tudo bem? Espero que sim!

Desculpe pela demora em retornar.

O shuffle é utilizado para embaralhar os dados antes de aplicar o cross_validate. Dessa forma, é evitado que a ordem do conjunto de dados influencie no resultado do modelo. Muitas vezes o conjunto de dados trás um padrão na ordem que estão os elementos, seja porque houve uma filtragem na tabela, na ordem que foi preenchida, etc.

Portanto, se aplicarmos o cross_validate diretamente nos dados sem o embaralhamento, pode ser que os conjuntos de treino e teste sejam muito diferentes uns dos outros, carregando características específicas, ocasionando em uma divisão ruim.

Bons estudos!

Importante

Trilhas por carreira

Carreiras de IA

Carreiras de Dados

Carreiras de Cyber

Carreiras de DevOps & Cloud

Carreiras de UX & UI

Carreiras de Mobile & Front-End

Carreiras de Back-End

Carreiras de Negócios

Cursos universitários FIAP

Importante

Tópicos relacionados

Conteúdos Alura com o tema

Trilhas por carreira

Carreiras de IA

Carreiras de Dados

Carreiras de Cyber

Carreiras de DevOps & Cloud

Carreiras de UX & UI

Carreiras de Mobile & Front-End

Carreiras de Back-End

Carreiras de Negócios

Cursos universitários FIAP