Nesta atividade, substituí o tradicional dataset Iris por um conjunto de flores de Clitória (Clitoria ternatea) para compreender, de maneira mais concreta, como funcionam os algoritmos de agrupamento e redução de dimensionalidade.



Mão na Massa – Aplicando Técnicas de Aprendizado Não Supervisionado em Imagens de Flores
Objetivo
Nesta atividade, substituí o tradicional dataset Iris por um conjunto de imagens de flores da espécie Clitoria ternatea, simulando uma situação real de Visão Computacional.
O objetivo foi compreender como algoritmos de Aprendizado Não Supervisionado conseguem identificar padrões em um conjunto de imagens sem receber previamente qualquer classificação.
Enquanto no dataset Iris as características (comprimento e largura das pétalas e sépalas) já estão medidas em uma tabela, nesta atividade partimos de imagens reais e analisamos quais características poderiam ser extraídas automaticamente por um sistema inteligente.
Conjunto de Dados
Foram utilizadas seis imagens contendo diferentes variações da Clitoria ternatea.
Imagem 1
Flor lilás simples.
Imagem 2
Flor azul simples.
Imagem 3
Conjunto de flores azuis.
Imagem 4
Flores brancas.
Imagem 5
Painel contendo diferentes variações naturais de cor da espécie.
Imagem 6
Flor vermelha.
Essas imagens representam um pequeno conjunto de dados que poderá ser analisado pelos algoritmos de clusterização.
Etapa 1 – Observação Humana
Antes de utilizar qualquer algoritmo, realizei uma observação visual das imagens.
As principais diferenças identificadas foram:
- cor predominante;
- intensidade da coloração;
- quantidade de flores presentes;
- abertura da flor;
- formato geral;
- tonalidade;
- contraste entre pétalas e centro da flor.
Minha hipótese inicial foi a existência dos seguintes agrupamentos:
- flores azuis;
- flores claras (brancas e lilases);
- flor vermelha;
- conjunto misto de flores.
Essa hipótese foi construída apenas pela observação humana.
Etapa 2 – Como a Inteligência Artificial "Enxerga" as Imagens
Um algoritmo não interpreta imagens como uma pessoa.
Antes da clusterização, um sistema de Visão Computacional transforma cada imagem em um conjunto de características numéricas (features), como:
- tonalidade média da imagem;
- saturação da cor;
- brilho;
- contraste;
- área ocupada pela flor;
- simetria;
- textura;
- quantidade de pétalas aparentes;
- formato;
- quantidade de flores presentes.
Assim, cada imagem deixa de ser uma fotografia e passa a ser representada por dezenas ou centenas de números.
Esses valores são utilizados pelos algoritmos de Machine Learning.
Etapa 3 – Aplicando o K-Means
Após a extração das features, imaginei a aplicação do algoritmo K-Means com quatro clusters.
A organização mais provável seria:
Cluster 1
Flores azuis.
Imagens:
- 2
- 3
Características predominantes:
- alta saturação;
- tonalidade azul intensa;
- centro branco;
- formato semelhante.
Cluster 2
Flores claras.
Imagens:
- 1
- 4
Características predominantes:
- baixa saturação;
- tonalidades claras;
- pétalas abertas;
- formato semelhante.
Cluster 3
Flor vermelha.
Imagem:
- 6
Características predominantes:
- tonalidade completamente diferente;
- alta intensidade da cor;
- padrão visual distinto.
Essa imagem provavelmente seria identificada como um grupo isolado ou como um possível outlier.