Olá! Não entendi muito bem como funciona o WCSS, também não ficou muito claro como foi definido o range utilizado (1,11)
Olá! Não entendi muito bem como funciona o WCSS, também não ficou muito claro como foi definido o range utilizado (1,11)
O WCSS (Weighted Cumulative Sum of Squares) é uma medida de similaridade entre duas sequências de pontos. É calculado somando os quadrados das distâncias entre os pontos de cada sequência, ponderadas pelo número de pontos em cada sequência. O range utilizado (1,11) foi definido para facilitar a comparação de similaridades entre sequências de diferentes comprimentos.
A fórmula para calcular o WCSS é a seguinte:
WCSS = Σ(i=1)^n (i-1)! * (n-i)! * d(i,j)^2
onde:
n
é o número de pontos na primeira sequênciai
é o índice de cada ponto na primeira sequênciad(i,j)
é a distância entre o ponto i
na primeira sequência e o ponto j
na segunda sequênciaO WCSS é uma medida de similaridade muito utilizada em aprendizado de máquina e processamento de linguagem natural. Ele pode ser usado para comparar sequências de DNA, RNA, proteínas, texto, imagens e outros tipos de dados.
O range utilizado (1,11) foi definido para facilitar a comparação de similaridades entre sequências de diferentes comprimentos. Isso porque o WCSS é um valor absoluto, e valores absolutos são sempre maiores para sequências mais longas. Ao utilizar o range (1,11), é possível normalizar o WCSS, tornando-o independente do comprimento das sequências.
Por exemplo, considere duas sequências de pontos com 5 e 10 pontos, respectivamente. O WCSS para essas duas sequências seria 25 e 121, respectivamente. No entanto, se normalizarmos o WCSS usando o range (1,11), obteríamos os seguintes valores: 0,23 e 1,09. Como você pode ver, os valores normalizados são muito semelhantes, mesmo que as sequências tenham comprimentos diferentes.
O WCSS é uma medida de similaridade muito útil, mas é importante notar que ele não é o único método possível. Existem outras medidas de similaridade que podem ser mais adequadas para um determinado conjunto de dados.
Se isso te ajudou marca como solucionado.