1
resposta

[Projeto] Minha experiência com o tema

Realizei um projeto na empresa ano passado em que acabamos num problema similar ao exemplo da instrutora. Tínhamos um conjunto de clusters com vários parâmetros e precisávamos explicar o significado de cada cluster para o cliente. Nós encontramos uma solução bem similar, mas mais estruturada. Como o processo precisava ficar rodando ad eternum no ambiente do cliente, criamos um algoritmo que, partindo das médias dos clusters, criava uma árvore de decisão. A ideia era:

  1. Partindo da base com os clusters e médias:
clustersBALANCEPURCHASESCASH_ADVANCECREDIT_LIMITPAYMENT
0444.41628.83143.425,130.73814.02
13,045.59387.061,625.214,495.43967.48
21,142.073,268.80183.844,094.433,046.70
31,797.74466.453,286.533,985.954,667.18
41,985.92855.01423.192,228.001,345.66
  1. Usando média e desvio padrão das médias dos clusters, classificar casa média como alta (1), média (0) e baixa (-1):
clustersBALANCEPURCHASESCASH_ADVANCECREDIT_LIMITPAYMENT
0-10-11-1
110010
201-101
300101
400-1-10
  1. Com isso, calculamos a variância das classificações de cada variável:
BALANCEPURCHASESCASH_ADVANCECREDIT_LIMITPAYMENT
0,50,20,80,70,7
  1. Assim, entendemos que a variável que mais separa os dados é CASH_ADVANCE. Logo, ela deve ser a primeira chave usada para separar os clusters:

Insira aqui a descrição dessa imagem para ajudar na acessibilidade 5) Com os clusters 1 e 3 separados, tiramos eles da tabela de clusters e recalculamos as variâncias, sem a CASH_ADVANCE:

BALANCEPURCHASESCREDIT_LIMITPAYMENT
0,330,3311
  1. Nesse cenário, tanto CREDIT_LIMIT quanto PAYMENT poderiam ser usados, pois apresentam a mesma variância e ela é a mais alta. Por ordem de aparição (poderia ser utilizado outro critério), utiilzamos a CREDIT_LIMIT como novo separador da árvore:

Insira aqui a descrição dessa imagem para ajudar na acessibilidade

Com isso, tínhamos criado uma árvore de decisão para os clusters encontrados. O algoritmo é super simples, mas o cliente ficou super satisfeito com o resultado. Achei que valia a pena compartilhar aqui essa experiência! Alguém com alguma história parecida? Sugestões para esse algoritmo?

1 resposta

Oi Miguel!

não tenho nenhuma história parecida, mas gostei muito de saber dessa sua! agradeço muito por compartilhar!

Quer mergulhar em tecnologia e aprendizagem?

Receba a newsletter que o nosso CEO escreve pessoalmente, com insights do mercado de trabalho, ciência e desenvolvimento de software