1
resposta

Dúvida sobre a dimensão da matriz de bias

Não entendi a formação da matriz de bias. No começo do código, considerando a arquitetura inicial com duas camadas, a primeira oculta com 3 nodos e a de saída, a primeira matriz de bias na iniciazação aleatória seria (3,1), antes da camada oculta. Meu problema está com esta dimensão, o número de colunas, porque na entrada de dados com 731 registros com 2 colunas (variáveis), o resultado da multiplicação da matriz pesos (3,2) pela matriz ativado_anterior (2,731) resulta em uma matriz (3,731). Não tem como somar esta matriz com a bias (3,1), por isso estou com dificuldade em entender como o código rodou.

1 resposta

Oi Pedro! Tudo bem contigo?

Desculpa a demora em te trazer um retorno.

A formação da arquitetura dos dados é feita pelas categorias de entrada como é mostrado no minuto 7:18 da aula Pesos e viés, onde a entrada são os dados de clima e temperatura. Por conta disso, apenas uma amostra de cada um desses dados entra na arquitetura por vez, ou seja, não existe uma arquitetura com 731 entradas, pois esses são os dados que as duas entradas do modelo, clima e temperatura, recebem.

Assim, a partir dos dados que cada uma das entradas vai recebendo, os valores de pesos vão sendo alterados de forma a gerar a menor quantidade de perdas para o modelo. Para entender melhor como um modelo de rede neural funciona sugiro bastante a leitura do tópico Não deveriam ter mais pesos na camada 1? e suas respectivas referências. Além da explicação de como funciona esse modelo, a instrutora explica também como funcionam as interações e o que cada resultado do modelo representa.

Em complementação a sugestão acima dada, recomendo também a leitura do tópico Tamanho matrix bias que o instrutor explica como funciona a soma dos valores da matriz de bias e onde os valores se conectam. Mesmo assim, eu entendo que esse assunto possa confundir um pouco quando tratamos dos cálculos para definir os valores das camadas ocultas.

Observando o conjunto dos dados que o professor disponibilizou mais adiante na aula Pesos e viés abaixo, podemos ver como funciona o cálculo para que sejam encontradas as camadas ocultas:

Alt text: Conjunto de prints da aula Pesos e viés. Acima na esquerda existe uma seta cinza apontada para as palavras “Propagação FeedFoward” que se localiza no centro superior da imagem. Abaixo da seta existe um modelo de arquitetura da rede usada no curso, com 3 divisões verticais. Da esquerda para a direita, temos a primeira divisão nomeada Entrada e nela  temos dois círculos cinza enfileirados verticalmente com um quadrado amarelo abaixo deles, o primeiro círculo tem em seu centro x1 e ao lado esquerdo a palavra Clima, o segundo círculo tem em seu centro x2 e ao lado esquerdo a palavra Temperatura, o quadrado amarelo tem o número 1 em seu centro. Indo para outra divisão temos 6 traços cinza e 3 vermelhos. Três dos seis traços cinzas saem do primeiro círculo e acima de cada traço tem as palavras p1, p3 e p5, os outros três traços cinza saem do segundo círculo e cada traço tem as palavras p2, p4 e p6, os 3 traços vermelhos saem do quadrado amarelo e cada traço tem as palavras b1, b2 e b3. A segunda divisão tem o nome de Oculta em sua parte superior e é composta por 3 círculos cinzas e um quadrado amarelo com o número 1 em seu centro enfileirados verticalmente. O 1°  círculo tem o número 1 em seu centro e a linhas p1, p2 e b1 ligadas a ele, o 2°  círculo tem o número 2 em seu centro e a linhas p3, p4 e b2 ligadas a ele e o 3°  círculo tem o número 3 em seu centro e a linhas p5, p6 e b3 ligadas a ele. De todos os elementos da segunda divisão saem traços cinzas que se ligam ao único elemento da 3° divisão. A 3° divisão tem o nome saída e um círculo cinza abaixo, ao lado direito do círculo existe o texto Bicicletas alugadas. Ao lado direito da arquitetura existe um conjunto que equações, a primeira indica que soma é igual ao somatório de x_i por p_i com i variando de 1 à N mais o valor de b_j, abaixo dela tem a equação soma é igual x1 vezes p1 mais x2 vezes p2 mais b1 que é igual a oculta 1, abaixo dela tem a equação soma é igual x1 vezes p3 mais x2 vezes p4 mais b2 que é igual a oculta 2 e abaixo dela tem a equação soma é igual x1 vezes p5 mais x2 vezes p6 mais b3 que é igual a oculta 3. Por fim, na 2° divisão da arquitetura, saem três setas azuis, a 1° seta aponta o 1° circulo para a 2° equação de soma, a 2° seta aponta o 2° círculo para a 3° equação de soma e a 3° seta aponta o 3° círculo para a 4° equação de soma

Os valores de cada camada são feitos realizando a soma da multiplicação dos pesos pelas suas respectivas entradas e somando os respectivos vieses. Note que, existem apenas duas entradas, que são utilizadas nos cálculos, e essas duas contribuem para encontrar o valor final da forma correta.

Espero ter te ajudado! Qualquer dúvida estarei à disposição ;-)

Caso este post tenha lhe ajudado, por favor, marcar como solucionado ✓.Bons Estudos!

Quer mergulhar em tecnologia e aprendizagem?

Receba a newsletter que o nosso CEO escreve pessoalmente, com insights do mercado de trabalho, ciência e desenvolvimento de software