2
respostas

Entendimento sobre a Criação de Descritores da Aula 6.02 (Pacote de Palavras Virtuais)

Sinceramente, não entendi o porque foi gerado esse descritor de tamanho 512, 32 posições. Logo em seguida, foi utilizado o algoritmo de Palavras Virtuais que confundiu ainda mais. Qual a ideia dessa etapa?

2 respostas

Alguma sugestão?

Oi Daniel,

Uma rápida resposta a isso:

Caso não tenha entendido, os descritores são úteis para computarmos de uma forma eficiente, valores que descrevam a imagem, estes valores são vetores (feature vectors) que buscam representar a imagem em determinados aspectos que são definidos por cada algoritmo, seja textura, cor, ou no caso do ORB que usa principalmente gradiente e o ângulo, porém é um pouco mais complicado pois envolve mais coisas.

Agora indo a sua pergunta, o valor 32 é do proprio algorito ORB, são 32 características diferentes obtidas de um ponto. O valor 512 foi um valor escolhido e é parâmetro, ou seja, podemos alterar este valor. Ele representa a quantidade de pontos que queremos extrair as características, ou seja, escolhemos 512 pontos nas imagens para descreve-las.

Como nós temos muitas imagens e cada imagem tem um retorno de 512 vetores com 32 posições cada, são muitos vetores diferentes sendo que há a possibilidade de cada imagem retornar valores diferentes das outras (exemplo: para 800 imagens teríamos 800*512=409600 vetores para treinar um algoritmo). Para simplificar isto nós utilizamos este algoritmo de palavras virtuais que clusteriza estes valores e nos possibilita ter para cada imagem o valor correspondente apenas aos valores das palavras virtuais (Para entender melhor sugiro ver este curso, mais escificamente aula 3).

Não sei se fui claro mas espero ter ajudado.

Quer mergulhar em tecnologia e aprendizagem?

Receba a newsletter que o nosso CEO escreve pessoalmente, com insights do mercado de trabalho, ciência e desenvolvimento de software