Solucionado (ver solução)
Solucionado
(ver solução)
2
respostas

Variáveis no modelo de regressão

Ei, pessoal!

Estou rodando um modelo de regressão mista para predizer a variação da ADM (amplitude de movimento) de dorsiflexão entre o teste final e inicial da temporada (adm_dorsi_dom_1_delta). Quando eu inclui o valor inicial do teste (adm_dorsi_dom_1_P), o valor do R2 do teste melhorou bastante...
Mas eu fiquei na dúvida se a estratégia que eu usei, incluir o valor inicial para predizer o delta, não seria um certo "doping estatístico"?

mixed_model1 <- lmer(
 adm_dorsi_dom_1_delta ~ modalidade + sexo + adm_dorsi_dom_1_P + (1 | codigo),
 data = df, REML = FALSE
)

summary(mixed_model1)
2 respostas
solução!

Ei, Guilherme! Tudo bem?

Incluir o valor inicial (baseline) não é doping estatístico. Na verdade, é uma prática recomendada em muitos casos. Ao colocar o valor inicial (adm_dorsi_dom_1_P) como uma variável preditora para o delta (adm_dorsi_dom_1_delta) pode ser uma abordagem válida, desde que faça sentido teoricamente. Isso é conhecido como "controle estatístico", onde você está controlando o efeito do valor inicial para entender melhor a variação que ocorre ao longo do tempo.

Mas considere se essa inclusão faz sentido para a sua pergunta de pesquisa. Se o valor inicial é algo que você espera que influencie a mudança (o delta), então incluí-lo no modelo pode ajudar a explicar a variação que você está observando. Por outro lado, se a sua intenção é medir a mudança pura sem considerar o ponto de partida, talvez seja melhor não o incluir. É preciso que interpretação dos resultados esteja sempre alinhada com a lógica do seu estudo e os objetivos da pesquisa.

Espero ter ajudado e qualquer dúvida, compartilhe no fórum.

Até mais!

Caso este post tenha lhe ajudado, por favor, marcar como solucionado!

Obrigado, Nathalia!
Ótima explicação...

Eu acredito que tenha sentido em inclui sim. Porém, pensei numa outra possibilidade, ao invés da variável independente do meu modelo ser o delta da ADM, eu troquei pela ADM final (Apenas o "pós"). O modelo melhorou ainda mais, mas por outro lado, estou com um impasse na interpretação: Falar que a ADM pré é uma forte preditora da ADM pós não seria muito óbvio? Então, mesmo que melhore objetivamente o modelo, não teria um avanço "teórico" muito relevante...
O que você acha?