1
resposta

08 Medidas de Validação

Como meu aprendizado quanto às partes teóricas dos cálculos foi extremamente prejudicada devido as aulas não estarem inclusivas para pessoas cegas como eu, não consigo responder essa atividade. Tentei chutar mas, não sei se por algum erro, todas as combinações que tentei fazer (a-b, a-c, a-d, b-c, b-d, etc) não deram como certo. Acredito que, com explicações e conteúdo inclusivo, consiga responder de forma adequada este exercício. Podem me ajudar? Obrigado

1 resposta

Olá, Pietro! Tudo bom com você? Espero que sim!

Desculpa a demora em responder, esse curso teve sua transcrição atualizada mas acredito que ainda apresenta muitas falhas em relação à inclusão, eu repassei esses problemas para o time responsável para que sejam feitas as devidas alterações, obrigada por nos informar, imagino quão decepcionante deve ter sido chutar os exercícios para resolver a atividade.

O exercício atualmente tem como resposta as letras A e C, infelizmente eu não tenho como acessar o curso antes da atualização para saber se essa questão foi alterada ou não e descobrir o porquê de não ter dado certo a combinação de letras que você informou.

Mesmo assim, a letra A traz a seguinte afirmação: "Os índices davies-bouldin e calinski harabasz utilizam centróides em seus cálculos”, isso é verdade pois ambos tem como principal fator as distâncias entre os centróides. A fórmula de calinski harabasz utiliza a distâncias de cada ponto para o centróide em sua fórmula como foi muito bem explicado por uma scuba no tópico índice Calinski-Harabasz. Já a fórmula de davies-bouldin é definida pelo somatório do maior valor das medidas de similaridade entre dois clusters dividido pela quantidade de clusters. Os centróides estão presentes na medida de similaridade que é calculada pela distância média entre cada ponto do cluster e seu centróide dividido pela distância entre os centróides dos outros clusters.

A letra C afirma que “A principal diferença do índice calinski harabasz em relação às outras medidas é o cálculo da variância” e também está correta, pois os outros dois métodos apresentados não levam o cálculo da variância, eles trabalham com médias, distâncias e outros cálculos matemáticos, mas não existe variância neles, apenas no índice calinski harabasz.

Já a letra B afirma que “O coeficiente de silhouette é calculado com base nos centróides de cada cluster” está incorreta pois o silhouette nem sequer utiliza centróides em seu cálculo, o que acontece é o cálculo das distâncias entre os elementos de um mesmo cluster e o cálculo das distâncias entre pontos de clusters diferentes. E por fim a letra D: “O índice calinski harabasz mede a separação entre dois clusters utilizando o centróide de cada cluster como ponto principal”, o erro dessa letra é que o índice calinski harabasz mede distâncias de cada ponto para o centróide do cluster o qual pertence e não a distância entre dois clusters.

Se as alternativas ainda não baterem ou surgir qualquer dúvida estarei à disposição, é só chamar.

Bons estudos!

Caso este post tenha lhe ajudado, por favor, marcar como solucionado ✓. Bons Estudos!