Sinceramente, não entendi o porque foi gerado esse descritor de tamanho 512, 32 posições. Logo em seguida, foi utilizado o algoritmo de Palavras Virtuais que confundiu ainda mais. Qual a ideia dessa etapa?
Sinceramente, não entendi o porque foi gerado esse descritor de tamanho 512, 32 posições. Logo em seguida, foi utilizado o algoritmo de Palavras Virtuais que confundiu ainda mais. Qual a ideia dessa etapa?
Alguma sugestão?
Oi Daniel,
Uma rápida resposta a isso:
Caso não tenha entendido, os descritores são úteis para computarmos de uma forma eficiente, valores que descrevam a imagem, estes valores são vetores (feature vectors) que buscam representar a imagem em determinados aspectos que são definidos por cada algoritmo, seja textura, cor, ou no caso do ORB que usa principalmente gradiente e o ângulo, porém é um pouco mais complicado pois envolve mais coisas.
Agora indo a sua pergunta, o valor 32 é do proprio algorito ORB, são 32 características diferentes obtidas de um ponto. O valor 512 foi um valor escolhido e é parâmetro, ou seja, podemos alterar este valor. Ele representa a quantidade de pontos que queremos extrair as características, ou seja, escolhemos 512 pontos nas imagens para descreve-las.
Como nós temos muitas imagens e cada imagem tem um retorno de 512 vetores com 32 posições cada, são muitos vetores diferentes sendo que há a possibilidade de cada imagem retornar valores diferentes das outras (exemplo: para 800 imagens teríamos 800*512=409600 vetores para treinar um algoritmo). Para simplificar isto nós utilizamos este algoritmo de palavras virtuais que clusteriza estes valores e nos possibilita ter para cada imagem o valor correspondente apenas aos valores das palavras virtuais (Para entender melhor sugiro ver este curso, mais escificamente aula 3).
Não sei se fui claro mas espero ter ajudado.