Base de dados heterogênea, como proceder?

Importante

Você está vendo a versão anterior da nova experiência da Alura que estamos preparando para você. Em breve, ela ganha uma identidade visual novinha totalmente pensada em potencializar seus estudos!

0
respostas

Referente ao curso Clustering: extraindo padrões de dados

por Alonso Ehlert

| 62.4k xp | 2 posts

Olá!

Finalizei ontem o curso de Clustering: extraindo padrões de dados, adorei o conteúdo e gostaria de aplicá-lo em um projeto no meu estágio.

O desafio é que, diferente do dataset deste curso, meu dataset é heterogêneo (contém dados inteiros, datas, strings, etc.) e necessitará de muito encoding antes de executar a clusterização.

Além disso o dataset ainda é de alta dimensionalidade, contendo 46 colunas no estado bruto.

Quais seriam as melhores opções para realizar o encoding dos dados e melhores opções de algoritmos para meu caso?

Além disso, imagino que no final a interpretação dos clusters também seria mais difícil, já que eu tenho muitos atributos não-numéricos.

Agradeço desde já sobre possíveis dicas e sugestões!

Abraços,

Alonso Ehlert

Importante

Trilhas por carreira

Carreiras de IA

Carreiras de Dados

Carreiras de Cyber

Carreiras de DevOps & Cloud

Carreiras de UX & UI

Carreiras de Mobile & Front-End

Carreiras de Back-End

Carreiras de Negócios

Cursos universitários FIAP

Importante

Tópicos relacionados

Conteúdos Alura com o tema

Trilhas por carreira

Carreiras de IA

Carreiras de Dados

Carreiras de Cyber

Carreiras de DevOps & Cloud

Carreiras de UX & UI

Carreiras de Mobile & Front-End

Carreiras de Back-End

Carreiras de Negócios

Cursos universitários FIAP