Tem alguma explicação por trás do uso dessa variável? Pois essa variável tem uma correlação quase nula. Acredito eu que seja improvável que a inclusão dessa variável no modelo de regressão linear irá melhorar o nosso modelo. Além de poder causar problemas, certo?
Mas é claro que antes de chegar em uma conclusão como "irá melhorar o nosso modelo", acredito eu que seja necessário uma melhor avaliação do modelo através de métricas como o p-valor e etc. Entretanto, a pergunta aqui é apenas de cunho teórico. Existe alguma razão para se adicionar variáveis com correlação quase nula? Ou é só checado mesmo no momento do ajuste do modelo?