Importante

Você está vendo a versão anterior da nova experiência da Alura que estamos preparando para você. Em breve, ela ganha uma identidade visual novinha totalmente pensada em potencializar seus estudos!

2
respostas

Mão na Massa – Aplicando técnicas de aprendizado não supervisionado com flores de Clitória

Nesta atividade, substituí o tradicional dataset Iris por um conjunto de flores de Clitória (Clitoria ternatea) para compreender, de maneira mais concreta, como funcionam os algoritmos de agrupamento e redução de dimensionalidade.
Insira aqui a descrição dessa imagem para ajudar na acessibilidade
Insira aqui a descrição dessa imagem para ajudar na acessibilidade
Insira aqui a descrição dessa imagem para ajudar na acessibilidade
Insira aqui a descrição dessa imagem para ajudar na acessibilidade

Insira aqui a descrição dessa imagem para ajudar na acessibilidade Insira aqui a descrição dessa imagem para ajudar na acessibilidade

Mão na Massa – Aplicando Técnicas de Aprendizado Não Supervisionado em Imagens de Flores

Objetivo

Nesta atividade, substituí o tradicional dataset Iris por um conjunto de imagens de flores da espécie Clitoria ternatea, simulando uma situação real de Visão Computacional.

O objetivo foi compreender como algoritmos de Aprendizado Não Supervisionado conseguem identificar padrões em um conjunto de imagens sem receber previamente qualquer classificação.

Enquanto no dataset Iris as características (comprimento e largura das pétalas e sépalas) já estão medidas em uma tabela, nesta atividade partimos de imagens reais e analisamos quais características poderiam ser extraídas automaticamente por um sistema inteligente.


Conjunto de Dados

Foram utilizadas seis imagens contendo diferentes variações da Clitoria ternatea.

Imagem 1
Flor lilás simples.

Imagem 2
Flor azul simples.

Imagem 3
Conjunto de flores azuis.

Imagem 4
Flores brancas.

Imagem 5
Painel contendo diferentes variações naturais de cor da espécie.

Imagem 6
Flor vermelha.

Essas imagens representam um pequeno conjunto de dados que poderá ser analisado pelos algoritmos de clusterização.


Etapa 1 – Observação Humana

Antes de utilizar qualquer algoritmo, realizei uma observação visual das imagens.

As principais diferenças identificadas foram:

  • cor predominante;
  • intensidade da coloração;
  • quantidade de flores presentes;
  • abertura da flor;
  • formato geral;
  • tonalidade;
  • contraste entre pétalas e centro da flor.

Minha hipótese inicial foi a existência dos seguintes agrupamentos:

  • flores azuis;
  • flores claras (brancas e lilases);
  • flor vermelha;
  • conjunto misto de flores.

Essa hipótese foi construída apenas pela observação humana.


Etapa 2 – Como a Inteligência Artificial "Enxerga" as Imagens

Um algoritmo não interpreta imagens como uma pessoa.

Antes da clusterização, um sistema de Visão Computacional transforma cada imagem em um conjunto de características numéricas (features), como:

  • tonalidade média da imagem;
  • saturação da cor;
  • brilho;
  • contraste;
  • área ocupada pela flor;
  • simetria;
  • textura;
  • quantidade de pétalas aparentes;
  • formato;
  • quantidade de flores presentes.

Assim, cada imagem deixa de ser uma fotografia e passa a ser representada por dezenas ou centenas de números.

Esses valores são utilizados pelos algoritmos de Machine Learning.


Etapa 3 – Aplicando o K-Means

Após a extração das features, imaginei a aplicação do algoritmo K-Means com quatro clusters.

A organização mais provável seria:

Cluster 1

Flores azuis.

Imagens:

  • 2
  • 3

Características predominantes:

  • alta saturação;
  • tonalidade azul intensa;
  • centro branco;
  • formato semelhante.

Cluster 2

Flores claras.

Imagens:

  • 1
  • 4

Características predominantes:

  • baixa saturação;
  • tonalidades claras;
  • pétalas abertas;
  • formato semelhante.

Cluster 3

Flor vermelha.

Imagem:

  • 6

Características predominantes:

  • tonalidade completamente diferente;
  • alta intensidade da cor;
  • padrão visual distinto.

Essa imagem provavelmente seria identificada como um grupo isolado ou como um possível outlier.


2 respostas

Cluster 4

Painel com múltiplas variações.

Imagem:

  • 5

Características predominantes:

  • várias flores;
  • diferentes tonalidades;
  • maior diversidade visual.

Dependendo das features utilizadas, poderia formar um agrupamento próprio.


Etapa 4 – Agrupamento Hierárquico

Em seguida, imaginei a aplicação do Agrupamento Hierárquico.

Nesse algoritmo não informamos previamente quantos grupos existem.

O sistema começa tratando cada imagem como um grupo independente e vai unindo aquelas que apresentam maior semelhança.

A estrutura esperada seria semelhante à seguinte:

Flores

├── Tons frios
│      ├── Azul simples
│      ├── Azul múltipla
│      └── Lilás
│
└── Outros grupos
       ├── Branca
       ├── Vermelha
       └── Painel misto

Após analisar o dendrograma, seria possível decidir quantos clusters representam melhor o conjunto de imagens.


Etapa 5 – Redução de Dimensionalidade (PCA)

Supondo que cada imagem gere dezenas de características numéricas, visualizar todas elas simultaneamente seria praticamente impossível.

Aplicando o PCA (Principal Component Analysis), essas dezenas de variáveis podem ser resumidas em apenas duas componentes principais.

Isso permitiria representar todas as imagens em um único gráfico bidimensional, preservando a maior parte das informações originais.

Nesse gráfico, seria esperado que:

  • as flores azuis permanecessem próximas;
  • as flores claras formassem outro agrupamento;
  • a flor vermelha aparecesse afastada dos demais grupos, evidenciando seu comportamento diferenciado.

Análise dos Resultados

A atividade demonstrou que algoritmos de aprendizado não supervisionado conseguem identificar padrões mesmo sem conhecer previamente as categorias existentes.

A etapa mais importante não é a clusterização em si, mas a transformação da imagem em um conjunto de características mensuráveis.

Essas características tornam possível que a Inteligência Artificial compare objetos, calcule semelhanças, forme agrupamentos e identifique padrões ocultos nos dados.

Também foi possível perceber que elementos muito diferentes dos demais — como a flor vermelha — tendem a formar grupos próprios ou serem identificados como anomalias (outliers), revelando informações importantes para a análise.


Conclusão

Ao adaptar o exercício do dataset Iris para imagens reais da Clitoria ternatea, foi possível compreender que os algoritmos de Machine Learning não trabalham diretamente com fotografias, mas com representações numéricas extraídas dessas imagens.

Os algoritmos K-Means, Agrupamento Hierárquico e PCA atuam sobre essas características para descobrir padrões, organizar grupos semelhantes e simplificar grandes volumes de informações.

Essa mesma lógica é utilizada em aplicações reais de Visão Computacional, como reconhecimento de plantas, classificação de espécies, agricultura de precisão, diagnóstico por imagens médicas e sistemas inteligentes de recomendação.

Mais do que reproduzir um exemplo clássico, esta adaptação demonstrou como os conceitos de aprendizado não supervisionado podem ser transferidos para problemas reais de análise de imagens, aproximando a teoria da prática.

Olá, Patricia! Como vai?

Parabéns pela realização das atividades!

Vi que você apresentou uma adaptação criativa do dataset clássico para Clitoria ternatea, explorou algoritmos como K-Means e PCA em imagens reais e destacou a importância da extração de features para que a IA consiga identificar padrões. Esse conjunto mostra inovação, clareza metodológica e aplicação prática, pontos que tornam o aprendizado mais próximo de cenários reais de Visão Computacional.

Se quiser aprofundar ainda mais, algumas boas práticas são:

  • Ampliar dataset: incluir mais imagens para aumentar a robustez dos agrupamentos.
  • Testar diferentes algoritmos: comparar resultados entre K-Means, DBSCAN e Hierárquico.
  • Visualizar resultados: usar gráficos interativos para interpretar melhor os clusters formados.

Ah uma pergunta: O que você considera mais enriquecedor nesse processo, perceber como a IA organiza padrões ocultos ou relacionar esses resultados com aplicações práticas como diagnóstico por imagens e agricultura de precisão?

Fico à disposição! E se precisar, conte sempre com o apoio do fórum.

Abraço e bons estudos!

AluraConte com o apoio da comunidade Alura na sua jornada. Abraços e bons estudos!