Solucionado (ver solução)
Solucionado
(ver solução)
1
resposta

Uso de dados não normalizados

Ao longo do curso foi dito que seria necessário usar os dados normalizados. Porém, a partir do vídeo "Visualizando os Clusters em três dimensões", o instrutor utiliza os dados antes de serem normalizados, qual é implicação da utilização dos dados não normalizados?

Notei que minha vizualização dos centros ficou diferente da apresentada, mas utilizei os dados normalizados como dito anteriormente.

1 resposta
solução!

Oi, Pedro! Tudo bem?

Desculpa a demora em te dar um retorno.

A normalização dos dados impacta no aprendizado e por isso também impacta na acurácia, por isso os resultados normalizados e os não-normalizados resultam em respostas diferentes.

Explicando melhor, alguns dados vem com colunas com diferentes tipos de dados, imagine um banco com dados que contenham uma coluna com idades e valor na conta bancária de alguns clientes, é fato que os números na coluna de conta bancária serão maiores que a coluna de idade, então se não normalizarmos, o modelo irá considerar que os dados na coluna de conta bancária serão bem mais importantes que os em idade. Isso não seria interessante para nosso objetivo.

Se você quer entender mais sobre isso, sugiro a leitura do artigo A importância da normalização e padronização dos dados em Machine Learning que faz uma explicação rápida e exemplificada do que relatei à você.

Espero ter te ajudado. Bons estudos!

Quer mergulhar em tecnologia e aprendizagem?

Receba a newsletter que o nosso CEO escreve pessoalmente, com insights do mercado de trabalho, ciência e desenvolvimento de software