Importante

Você está vendo a versão anterior da nova experiência da Alura que estamos preparando para você. Em breve, ela ganha uma identidade visual novinha totalmente pensada em potencializar seus estudos!

3
respostas

Aplicando Cadeias de Markov para Previsão de Permanência Escolar e Renovação de Matrículas

Aplicando Cadeias de Markov para Previsão de Permanência Escolar e Renovação de Matrículas

Ao estudar as Cadeias de Markov, percebi que sua aplicação pode ir muito além da previsão do tempo apresentada na aula. Como atuo na área educacional e venho desenvolvendo a Plataforma Inteligente de Gestão, Análise e Comunicação da Avaliação Formativa do Aprendiz (AFA), resolvi adaptar a atividade proposta para aplicá-la a um problema real enfrentado pelas escolas: a previsão do risco de não renovação de matrícula.

Optei por realizar essa adaptação porque acredito que a aprendizagem se torna mais significativa quando conseguimos transferir os conceitos estudados para desafios concretos de nossa área de atuação. Embora o exemplo da previsão do tempo seja bastante adequado para compreender o funcionamento das Cadeias de Markov, meu objetivo foi demonstrar como o mesmo raciocínio probabilístico pode apoiar a tomada de decisão em contextos educacionais.

Atualmente, venho desenvolvendo a Plataforma Inteligente de Gestão, Análise e Comunicação da Avaliação Formativa do Aprendiz (AFA), um sistema voltado para o acompanhamento acadêmico, comportamental e socioemocional dos estudantes. Ao estudar as Cadeias de Markov, percebi que a lógica utilizada para prever mudanças climáticas poderia ser aplicada à previsão de transições nos estados de permanência escolar dos alunos.

A proposta consiste em alimentar a plataforma AFA com planilhas Excel contendo dados de engajamento, desempenho, comportamento e participação dos estudantes, além de registros de atendimentos pedagógicos, psicológicos e históricos de relacionamento das famílias com a escola. Esses dados seriam importados periodicamente para a plataforma, formando uma base histórica capaz de representar o estado atual de cada estudante e de sua família.

A partir dessas informações, o sistema aplicaria Cadeias de Markov para analisar a probabilidade de transição entre diferentes estados de permanência escolar. Assim, um aluno poderia evoluir entre estados como Estável, Atenção, Risco e Crítico, enquanto as famílias poderiam ser classificadas em perfis como Parceira, Delegadora, Vinculada ou Insatisfeita. Com base no estado atual identificado nas planilhas, a Cadeia de Markov estimaria os estados futuros mais prováveis e o risco de não renovação da matrícula.

A escolha desse contexto se justifica porque a decisão de permanência em uma escola raramente depende de um único fator. Normalmente ela resulta da combinação entre desempenho acadêmico, participação escolar, aspectos socioemocionais, experiências vividas pelo estudante e percepção da família sobre a capacidade da instituição de atender às suas necessidades.

Por exemplo, um estudante que apresenta aumento de faltas, queda nas notas, relato de bullying, envolvimento em situações de agressão, redução da participação em eventos e viagens escolares e procura frequente por apoio psicológico pode estar demonstrando sinais de enfraquecimento de seu vínculo com a escola. Da mesma forma, a família pode influenciar esse processo de maneiras distintas. Uma família participativa e parceira pode optar por permanecer na instituição por confiar no trabalho pedagógico, mas também pode considerar a transferência caso perceba que as necessidades do estudante não estão sendo atendidas. Já uma família pouco participativa pode permanecer por delegar à escola a gestão dos problemas do estudante ou, ao contrário, decidir pela transferência ao considerar que a instituição não conseguiu resolvê-los.

Dessa forma, o sistema deixa de atuar apenas de maneira reativa, quando a transferência já está sendo solicitada, e passa a atuar preventivamente, identificando padrões de risco e apoiando a gestão escolar na construção de estratégias de retenção, acolhimento e fortalecimento do vínculo entre aluno, família e escola.

Além de aplicar os conceitos estudados na aula, essa proposta busca demonstrar como modelos probabilísticos podem ser utilizados para transformar dados educacionais em informações estratégicas. Ao final do processamento, a plataforma gera dashboards por turma, permitindo que a equipe gestora visualize alunos em situação de atenção, risco ou criticidade, identifique perfis familiares que demandam maior aproximação institucional e desenvolva ações preventivas baseadas em evidências.

Dessa forma, a atividade deixa de ser apenas uma simulação de previsão climática e passa a representar uma aplicação concreta da Inteligência Artificial na gestão educacional, demonstrando como as Cadeias de Markov podem apoiar a permanência escolar, a retenção de estudantes e a sustentabilidade institucional.

Fluxo de funcionamento

Planilhas Excel

Importação para a AFA

Tratamento dos dados

Classificação dos estados

Aplicação das Cadeias de Markov

Previsão de permanência

Dashboard por turma

Tomada de decisão da gestão

Estados do Aluno

  • Estável
  • Atenção
  • Risco
  • Crítico
3 respostas

Exemplo de classificação

Aluno com:

  • faltas frequentes;
  • relato de bullying;
  • queda nas notas;
  • envolvimento em agressão;
  • baixa participação em eventos;
  • baixa participação em viagens;
  • acompanhamento psicológico.

Pode ser classificado como:

Estado = Crítico

Perfis da Família

Família Parceira

  • participa das reuniões;
  • responde comunicados;
  • acompanha o estudante;
  • mantém diálogo com a escola.

Família Delegadora

  • transfere à escola toda a responsabilidade pelo desenvolvimento do estudante;
  • procura a instituição apenas em situações críticas.

Família Vinculada

  • possui forte sentimento de pertencimento;
  • participa frequentemente das ações institucionais.

Família Insatisfeita

  • apresenta histórico recorrente de reclamações;
  • demonstra baixa confiança institucional.

Matriz de Transição de Markov

Estado AtualEstávelAtençãoRiscoCrítico
Estável0.800.150.040.01
Atenção0.250.500.200.05
Risco0.100.250.450.20
Crítico0.050.100.250.60

Estrutura da Planilha

Campo
Aluno
Turma
Faltas
Queixa_Bullying
Atendimento_Psicologia
Situacao_Agressao
Queda_Notas
Participa_Viagens
Participa_Eventos
Participacao_Aulas
Familia_Participativa
Familia_Delegadora
Familia_Insatisfeita
Contato_Familia
Intencao_Transferencia

Implementação em Python

import pandas as pd
import numpy as np

estados = ["Estável", "Atenção", "Risco", "Crítico"]

matriz_transicao = {
    "Estável": [0.80, 0.15, 0.04, 0.01],
    "Atenção": [0.25, 0.50, 0.20, 0.05],
    "Risco": [0.10, 0.25, 0.45, 0.20],
    "Crítico": [0.05, 0.10, 0.25, 0.60]
}

probabilidade_renovacao = {
    "Estável": 0.95,
    "Atenção": 0.80,
    "Risco": 0.55,
    "Crítico": 0.25
}

def calcular_pontuacao(aluno):
    pontos = 0

    if aluno["Faltas"] >= 5:
        pontos += 2

    if aluno["Queixa_Bullying"] == "Sim":
        pontos += 3

    if aluno["Atendimento_Psicologia"] == "Sim":
        pontos += 2

    if aluno["Situacao_Agressao"] == "Sim":
        pontos += 3

    if aluno["Queda_Notas"] == "Sim":
        pontos += 2

    if aluno["Participa_Viagens"] == "Não":
        pontos += 1

    if aluno["Participa_Eventos"] == "Não":
        pontos += 1

    if aluno["Participacao_Aulas"] == "Baixa":
        pontos += 2

    if aluno["Familia_Participativa"] == "Sim":
        pontos -= 1

    if aluno["Familia_Delegadora"] == "Sim":
        pontos += 2

    if aluno["Familia_Insatisfeita"] == "Sim":
        pontos += 3

    if aluno["Contato_Familia"] == "Baixo":
        pontos += 2

    if aluno["Intencao_Transferencia"] == "Sim":
        pontos += 4

    return pontos

def classificar_estado(pontos):
    if pontos <= 2:
        return "Estável"
    elif pontos <= 5:
        return "Atenção"
    elif pontos <= 9:
        return "Risco"
    else:
        return "Crítico"

def prever_proximo_estado(estado):
    return np.random.choice(
        estados,
        p=matriz_transicao[estado]
    )

df = pd.read_excel("dados_alunos_afa.xlsx")

resultados = []

for _, aluno in df.iterrows():

    pontos = calcular_pontuacao(aluno)

    estado_atual = classificar_estado(pontos)

    proximo_estado = prever_proximo_estado(
        estado_atual
    )

    renovacao = (
        probabilidade_renovacao[estado_atual]
        * 100
    )

    resultados.append({
        "Aluno": aluno["Aluno"],
        "Turma": aluno["Turma"],
        "Estado Atual": estado_atual,
        "Próximo Estado": proximo_estado,
        "Probabilidade de Renovação":
            f"{renovacao:.0f}%"
    })

resultado_df = pd.DataFrame(resultados)

dashboard_turma = (
    resultado_df
    .groupby(["Turma", "Estado Atual"])
    .size()
    .unstack(fill_value=0)
)

print(resultado_df)

print(dashboard_turma)

Resultado Esperado

Ao final do processamento, a AFA gera:

Relatório Individual

  • estado atual do aluno;
  • próximo estado previsto;
  • probabilidade de renovação;
  • alerta pedagógico.

Dashboard por Turma

  • quantidade de alunos em cada estado;
  • percentual de risco de não renovação;
  • famílias parceiras, delegadoras e insatisfeitas;
  • alunos prioritários para intervenção;
  • previsão geral de rematrícula da turma.

Dessa forma, a aplicação das Cadeias de Markov deixa de ser apenas um exercício de previsão climática e passa a apoiar um problema real de gestão educacional: a permanência escolar, a retenção de estudantes e a sustentabilidade institucional.

Oi, Patricia. Tudo bem?

Seu trabalho ficou muito interessante porque você conseguiu sair do exemplo da previsão do tempo e aplicar as Cadeias de Markov em um problema real da área educacional. A ideia de representar os estudantes em estados como Estável, Atenção, Risco e Crítico mostra uma boa compreensão da lógica de transição entre estados e do uso de modelos probabilísticos.

Também ficou bem coerente a relação entre os dados da planilha, a classificação dos alunos, a matriz de transição e a geração de dashboards por turma. Isso mostra como Python, Pandas e NumPy podem apoiar uma análise preditiva voltada à permanência escolar e à renovação de matrículas, sem perder o foco pedagógico da proposta.

Ótima adaptação da atividade e boa conexão entre inteligência artificial, dados educacionais e tomada de decisão na gestão escolar.
Como próximo passo, você pretende testar essa proposta com dados
simulados ou já imagina aplicar a matriz de transição com dados reais da plataforma AFA?

Fico à disposição. Abraços e bons estudos!

Conteúdos relacionados
Python para análise de dados: um guia para a habilidade mais valorizada do mercado
Como aprender melhor? Com Diogo Pires | #HipstersPontoTube