Nesta atividade, apliquei duas técnicas fundamentais para aumentar a qualidade de modelos de Machine Learning: o ajuste de hiperparâmetros e a seleção de features.
Ajuste de hiperparâmetros com Grid Search
Utilizando o dataset California Housing, apliquei a técnica Grid Search em um modelo de Árvore de Decisão.
Compreendi que um mesmo algoritmo pode apresentar desempenhos bastante diferentes dependendo da configuração de seus hiperparâmetros. Como não existe uma combinação ideal definida previamente, o Grid Search automatiza essa busca, testando diferentes combinações de parâmetros, como max_depth, min_samples_split e min_samples_leaf.
Ao executar o processo, observei que o algoritmo avaliou sistematicamente todas as combinações possíveis por meio de validação cruzada (cross validation) e retornou automaticamente aquela que apresentou o menor erro de previsão. Esse procedimento reduz o risco de escolhas baseadas apenas na tentativa e erro e torna o processo de otimização mais confiável.
Seleção de features
Na segunda etapa, utilizei o modelo Random Forest para analisar o conjunto de dados sobre diabetes e identificar quais variáveis eram mais relevantes para as previsões.
O gráfico de importância das features mostrou que nem todas as informações possuem o mesmo peso para o modelo. Algumas variáveis exercem grande influência sobre as previsões, enquanto outras contribuem muito pouco.
Essa análise demonstrou que um bom modelo não depende apenas da quantidade de dados disponíveis, mas principalmente da qualidade das informações utilizadas. Ao eliminar variáveis pouco relevantes, reduzimos a complexidade do modelo, melhoramos sua capacidade de generalização e facilitamos a interpretação dos resultados.
Reflexão
A principal aprendizagem desta atividade foi compreender que melhorar um modelo de Machine Learning não significa necessariamente trocar de algoritmo. Muitas vezes, os maiores ganhos de desempenho são obtidos por meio do ajuste adequado dos hiperparâmetros e da seleção criteriosa das features que realmente explicam o fenômeno estudado.
Também compreendi que o desenvolvimento de modelos é um processo de experimentação contínua, no qual diferentes configurações são avaliadas até encontrar aquela que oferece o melhor equilíbrio entre precisão, capacidade de generalização e simplicidade.
Aplicação à Plataforma Inteligente AFA
Esses conceitos possuem aplicação direta no desenvolvimento da Plataforma Inteligente AFA.
O ajuste de hiperparâmetros permitirá otimizar modelos responsáveis por prever estudantes com maior probabilidade de necessitar de intervenção pedagógica.
Já a seleção de features possibilitará identificar automaticamente quais indicadores possuem maior poder preditivo. Em vez de considerar todos os registros com o mesmo peso, o sistema poderá descobrir, por exemplo, que uma sequência de registros comportamentais negativos associada à queda da frequência explica melhor a necessidade de intervenção do que apenas a média das avaliações.
Essa abordagem permitirá construir modelos mais precisos, interpretáveis e fundamentados em evidências, fortalecendo a tomada de decisão pedagógica baseada em dados.