Nesse casso de regressão multipla, não preciso criar um vetor com as variaveis explicativas?
Nesse casso de regressão multipla, não preciso criar um vetor com as variaveis explicativas?
Olá Matheus, tudo bem?
Na regressão linear múltipla, é necessário incluir todas as variáveis explicativas que você deseja usar no modelo. Mas no caso da biblioteca statsmodels
, você não precisa criar explicitamente um vetor no formato de array NumPy para as variáveis explicativas, pois o StatsModels trabalha diretamente com DataFrames do Pandas. O statsmodels
entende que cada coluna do DataFrame representa uma variável explicativa. Portanto, a estrutura do DataFrame já contém toda a informação necessária para a regressão múltipla.
Então, o que você precisa fazer é garantir que o DataFrame contenha todas as variáveis explicativas (colunas) e adicionar uma coluna de constante, que é exigida para estimar o intercepto do modelo.
Espero ter esclarecido.
Qualquer dúvida, não hesite em compartilhar no fórum.
Abraços!