Olá! Não entendi muito bem como funciona o WCSS, também não ficou muito claro como foi definido o range utilizado (1,11)
Você está vendo a versão anterior da nova experiência da Alura que estamos preparando para você. Em breve, ela ganha uma identidade visual novinha totalmente pensada em potencializar seus estudos!
Olá! Não entendi muito bem como funciona o WCSS, também não ficou muito claro como foi definido o range utilizado (1,11)
O WCSS (Weighted Cumulative Sum of Squares) é uma medida de similaridade entre duas sequências de pontos. É calculado somando os quadrados das distâncias entre os pontos de cada sequência, ponderadas pelo número de pontos em cada sequência. O range utilizado (1,11) foi definido para facilitar a comparação de similaridades entre sequências de diferentes comprimentos.
A fórmula para calcular o WCSS é a seguinte:
WCSS = Σ(i=1)^n (i-1)! * (n-i)! * d(i,j)^2
onde:
n é o número de pontos na primeira sequênciai é o índice de cada ponto na primeira sequênciad(i,j) é a distância entre o ponto i na primeira sequência e o ponto j na segunda sequênciaO WCSS é uma medida de similaridade muito utilizada em aprendizado de máquina e processamento de linguagem natural. Ele pode ser usado para comparar sequências de DNA, RNA, proteínas, texto, imagens e outros tipos de dados.
O range utilizado (1,11) foi definido para facilitar a comparação de similaridades entre sequências de diferentes comprimentos. Isso porque o WCSS é um valor absoluto, e valores absolutos são sempre maiores para sequências mais longas. Ao utilizar o range (1,11), é possível normalizar o WCSS, tornando-o independente do comprimento das sequências.
Por exemplo, considere duas sequências de pontos com 5 e 10 pontos, respectivamente. O WCSS para essas duas sequências seria 25 e 121, respectivamente. No entanto, se normalizarmos o WCSS usando o range (1,11), obteríamos os seguintes valores: 0,23 e 1,09. Como você pode ver, os valores normalizados são muito semelhantes, mesmo que as sequências tenham comprimentos diferentes.
O WCSS é uma medida de similaridade muito útil, mas é importante notar que ele não é o único método possível. Existem outras medidas de similaridade que podem ser mais adequadas para um determinado conjunto de dados.
Se isso te ajudou marca como solucionado.