[Dúvida] Em Redes Neurais Recorrentes(RNNs), qual é a formula matemática para calcular os estados ocultos ? | Data Science

Solucionado (ver solução)

Solucionado
(ver solução)

2
respostas

por William Alves Jardim

| 224.9k xp | 91 posts

Em cursos aqui da Alura, vi explicações sobre como as RNNs funcionam. Eu tirei uma print de uma imagem de um curso que eu gostaria de fazer essas perguntas:

A imagem do curso que eu gostaria de perguntar Nesse curso, e em outro curso aqui da Alura, os professores disseram que na RNN cada unidade tem um "loop interno". Eles dizem que as saidas de cada unidade vão ser usadas como entradas adicionais para elas mesmas no próximo instante de tempo(ou seja, quando a RNN estiver processando a proxima amostra do dataset). Eles explicam que esse "loop interno" é chamado de estado oculto da unidade. Eles explicam que as amostras são os instantes de tempo, e que ao processar a primeira amostra, ou seja, o primeiro instante de tempo, o estado oculto dela é simplismente zero(pois o H0 é inicializado com zero). Mais, quando ele vai processar o segundo instante de tempo(ou seja, a segunda amostra), as unidades recebem as entradas dessa amostra e MAIS o estado oculto do instante de tempo anterior(ou seja, o estado oculto da amostra passada). Ou seja, esses cursos explicam que as saidas das unidades são usadas não somente nas camadas seguintes, mais também, são arquivadas para serem usadas no instante de tempo seguinte(ou seja, ao processar a proxima amostra, além de processar as entradas dela, ele vai usar também o estado oculto do instante de tempo anterior, criando um efeito de dependencia de sequencia ).

Tenho mais algumas perguntas que gostaria de fazer:

DUVIDAS:

Qual é a fórmula matemática para calcular o estado oculto Ht da imagem ?
Esse valor "H(t-1)" ele é um vetor ou é um número ?

2 respostas

solução!

por NATHALIA QUEIROZ

| 3144.4k xp | 7288 posts

Alura Scuba Team

22/01/2025

Oii, William! Como esse assunto requer um conhecimento mais aprofundado sobre redes neurais, abaixo deixo alguns links que poderão te ajudar nessas dúvidas pontuais:

Recomendo começar com o artigo Redes Neurais Recorrentes (RNN). Ele traz uma explicação detalhada da fórmula matemática, incluindo o papel de ht−1h_{t-1}ht−1, e como ele funciona como um vetor que armazena informações temporais acumuladas. Como complemento, sugiro mais dois artigos que podem enriquecer seu entendimento:

Medium - Redes Neurais RNN, que discute de forma técnica e prática como as RNNs lidam com o estado oculto.
Redes Neurais Recorrentes:RNN, LSTM e GRU, que aprofunda o conceito de memória em redes neurais, destacando ht−1h_{t-1}ht−1 como um vetor fundamental no processamento sequencial. Esses materiais abordam o tema de forma clara, técnica e com exemplos que ajudam a visualizar melhor o funcionamento das RNNs. Tenho certeza de que vão te ajudar a consolidar o aprendizado.

Espero que os artigos te ajude a entender um pouco mais sobre a fórmula.

Bons estudos, William!

por William Alves Jardim

| 224.9k xp | 91 posts

27/01/2025

Olá, Nathalia. Obrigado por mencionar os artigos!. Vou ler pra me aprofundar.