[Projeto] Sessão 2 - Otimização e Taxa de Aprendizado | Treinando uma Rede Neural: Deep Learning com PyTorch

LEANDRO DOS SANTOS MOQUIUTI FERREIRA · 2026-06-19 10:18

No experimento inicial, as taxas **0.01**, **0.05** , **0.1** e **0.5** causaram divergência, levando a *loss* para *inf* e depois *nan*. Isso indica que os passos de atualização foram **grandes** de

E a conclusão da segunda versão, com ajuste:

Ao normalizar também o target, o treinamento se tornou mais estável e permitiu comparar melhor taxas de aprendizado maiores. Isso mostra que a escolha do learning rate depende diretamente da escala dos dados, da função de perda e da arquitetura usada.

Oi, Leandro! Como vai?

Obrigada por compartilhar suas descobertas com a comunidade. Suas conclusões sobre o projeto da Sessão 2 de Otimização e Taxa de Aprendizado estão bem fundamentadas e merecem atenção.

No experimento inicial, você identificou com precisão que as taxas de aprendizado mais altas, como 0.1 e 0.5, causaram divergência, levando a loss para inf e depois para nan. Reconhecer esse comportamento é essencial para entender como a escolha do learning rate impacta a estabilidade do treinamento.

A sua segunda conclusão também é muito relevante. Ao normalizar o target, o treinamento se tornou mais estável e permitiu comparar melhor taxas de aprendizado maiores. Esse resultado reforça uma ideia central em deep learning: a escala dos dados, a função de perda e a arquitetura usada influenciam diretamente qual taxa de aprendizado será mais adequada para cada cenário.

Uma dica complementar: além de observar quando a loss vira inf ou nan, registre a curva de perda por época para visualizar de forma mais clara como cada taxa contribui para a convergência ao longo do treinamento. Esse tipo de visualização enriquece muito a análise e facilita a comunicação dos resultados.

Continue explorando e compartilhando suas descobertas por aqui. Bons estudos!

O que você achou mais interessante ao comparar o comportamento do modelo antes e depois da normalização dos dados?

Conteúdo relacionado:

VÍDEO

Nem todo problema precisa de Deep Learning #inteligenciaartificial

ARTIGO

Deep Learning: o guia completo para iniciantes

Conte com o apoio da comunidade Alura na sua jornada. Abraços e bons estudos!

Importante

[Projeto] Sessão 2 - Otimização e Taxa de Aprendizado

E a conclusão da segunda versão, com ajuste:

Trilhas por carreira

Carreiras de IA

Carreiras de Dados

Carreiras de Cyber

Carreiras de DevOps & Cloud

Carreiras de UX & UI

Carreiras de Mobile & Front-End

Carreiras de Back-End

Carreiras de Negócios

Cursos universitários FIAP

Importante

E a conclusão da segunda versão, com ajuste:

Tópicos relacionados

Conteúdos Alura com o tema

Trilhas por carreira

Carreiras de IA

Carreiras de Dados

Carreiras de Cyber

Carreiras de DevOps & Cloud

Carreiras de UX & UI

Carreiras de Mobile & Front-End

Carreiras de Back-End

Carreiras de Negócios

Cursos universitários FIAP