Importante

Você está vendo a versão anterior da nova experiência da Alura que estamos preparando para você. Em breve, ela ganha uma identidade visual novinha totalmente pensada em potencializar seus estudos!

1
resposta

[Sugestão] Mãos na massa: utilizando o modelo salvo

https://colab.research.google.com/drive/1EgzkKeYlpzV0Nrn8_mRbnqyNU-mt-w77?usp=sharing

Olá, instrutores!
Aqui está minha implementação da atividade "Utilizando o Modelo Salvo". Documentei as decisões que um ambiente de produção real exige.
Decisões técnicas:
1 — joblib no lugar de pickle: o próprio sklearn recomenda explicitamente o joblib para serializar estimadores, pois internamente eles carregam arrays NumPy grandes — o joblib aplica compressão e memory-mapping automaticamente, enquanto o pickle serializa byte a byte sem otimização.
2 — DataFrame com colunas nomeadas como input: model.predict([lista]) funciona, mas cria dependência implícita na ordem dos elementos. Em produção, qualquer refatoração da feature engineering quebraria silenciosamente a predição. Com um DataFrame nomeado, o schema é explícito e auditável.
3 — Classificação de negócio no output: um float isolado não comunica nada para operações. Adicionei uma função classificar_atraso() que traduz minutos em faixas operacionais — leve, moderado, crítico — alinhando a saída do modelo com a linguagem da área de negócio.
Ponto de atenção: o modelo atual não retorna intervalos de confiança. Em produção, o ideal seria expor também a incerteza da predição (ex: via predict de modelos probabilísticos ou bootstrap). Isso é uma limitação conhecida do RandomForestRegressor padrão sem calibração adicional.
Agradeço o feedback!

1 resposta

Olá, Hewerson. Como vai? Agradeço por compartilhar sua implementação com a comunidade Alura.

Sua entrega ficou muito bem detalhada e mostra uma preocupação importante com o uso do modelo em um cenário mais próximo de produção. Gostei especialmente de como você justificou a escolha do joblib para serializar o modelo, já pensando em desempenho e compatibilidade com estruturas que usam arrays NumPy maiores.

Outro ponto muito positivo foi o uso de um DataFrame com colunas nomeadas como entrada para a predição. Essa decisão deixa o processo mais explícito, reduz a dependência da ordem dos valores e facilita a manutenção do código caso a estrutura das variáveis mude no futuro.

Também foi muito interessante você transformar a saída numérica em uma classificação de negócio com a função classificar_atraso(). Esse tipo de cuidado aproxima o resultado do modelo da realidade de quem precisa tomar decisões, tornando a predição mais fácil de interpretar por equipes operacionais.

O ponto de atenção sobre intervalos de confiança também foi bem colocado. Em aplicações reais de Machine Learning, além da previsão, entender o grau de incerteza pode ajudar bastante na tomada de decisão. Sua implementação ficou muito completa e trouxe boas reflexões sobre versionamento, entrada de dados, interpretação de resultados e uso do modelo em produção. Qual dessas decisões você considera mais importante para tornar um modelo mais confiável fora do ambiente de estudo?

Alura Conte com o apoio da comunidade Alura na sua jornada. Abraços e bons estudos.