Boa tarde. Em relação ao exercício proposto, rodei paralelamente dois modelos, um com a variável área, e outro não. Desde o inicio, pelo método corr(), percebi que havia pouca relação entre a variável área e a variável dependente, por isso resolvi rodar os dois e ver a diferença. No score() do primeiro o valor foi 0.65, na metrics o resultado se repetiu. No score() do segundo o valor foi 0.63, na metrics o resultado se repetiu. No final, nas métricas EQM e REQM os valores do primeiro foram: 47204482.34, 6870.55 No final, nas métricas EQM e REQM os valores do primeiro foram: 48966307.73, 6997.59 Os valores do segundo foram levemente piores, subtraindo as duas métricas(1º - 2º), gerou: -1761825.39, -127.04(não sei interpretar se esse valor é muito grande para esse conjunto)
A minha dúvida é: Se eu estivesse rodando um teste que demande alta precisão, acho que independente do resultado de performace(extrapolando para um espaço amostral muito maior) ficaria com o primeiro, mas se minha aplicação não visasse tanta precisão, essa diferença de acurácia geraria impactos significativos na performace? Demandaria um hardware muito melhor?
grato