2
respostas

Ordem dos fatores muda o produto

Olá gente!

Eu estou realizando um projeto que necessita normalizar os dados de imóveis (preço, m²) com o objetivo de conseguir o preço do m² por cidade/bairro e os dados estão extremamente bagunçados similar ao case da aula.

Como quero obter o preço por m², dividi um pelo outro com os dados não normalizados, após isso realizei a normalização com log e obtive duas saídas possíveis:

**1- ** dividir o m² pelo preço antes de normalizar e depois normalizar essa razão entre as duas variáveis.

2- normalizar as duas variáveis e após isso aplicar a razão entre elas.

2 respostas

Oii, Yan! Tudo bem?

A sua dúvida é muito pertinente. A ordem das operações pode sim influenciar o resultado final, principalmente quando estamos lidando com normalização de dados.

Vamos aos seus dois cenários:

  • Dividir o m² pelo preço antes de normalizar e depois normalizar essa razão entre as duas variáveis.

Aqui, você estará normalizando a razão já calculada entre m² e preço. Isso significa que a normalização será aplicada ao resultado dessa divisão, ou seja, ao preço por m².

  • Normalizar as duas variáveis e após isso aplicar a razão entre elas.

Já nesse cenário, você estará dividindo os valores normalizados de m² e preço. Isso significa que a razão será calculada entre os valores normalizados de m² e preço.

A escolha entre esses dois cenários vai depender do que você quer analisar. Se você quer analisar a distribuição do preço por m², o primeiro cenário pode ser mais adequado. Se você quer entender a relação entre o m² e o preço já normalizados, o segundo cenário pode ser mais apropriado.

Se outra dúvida surgir, estamos disponíveis aqui no fórum! :)

Abraços.

Caso este post tenha lhe ajudado, por favor, marcar como solucionado ✓.

Muito grato pela resposta!!

Nesse caso, vou aplicar a primeira opção, pois está bem normalizada a curva!!