Gostaria de saber um exemplo específico de quando usar a regressão linear e QUANDO NÃO usar, e o motivo disso..
Você está vendo a versão anterior da nova experiência da Alura que estamos preparando para você. Em breve, ela ganha uma identidade visual novinha totalmente pensada em potencializar seus estudos!
Gostaria de saber um exemplo específico de quando usar a regressão linear e QUANDO NÃO usar, e o motivo disso..
Oi Robson, tudo bem?
É ótimo ver seu interesse em entender profundamente quando aplicar ou não a regressão linear. Vamos lá!
A regressão linear é ideal para situações onde existe uma relação linear clara entre as variáveis independentes e a variável dependente. Por exemplo, você pode usar a regressão linear para prever o preço de imóveis com base em características como área, número de quartos, e localização, assumindo que essas relações são aproximadamente lineares.
No entanto, há situações em que a regressão linear não é recomendada:
Relações Não Lineares: Se os dados mostram relações não lineares fortes, como curvas ou ciclos, a regressão linear pode não ser capaz de capturar adequadamente essas relações. Por exemplo, se você estiver tentando modelar o crescimento populacional de uma espécie que segue uma curva logística, a regressão linear não seria adequada.
Qualidade dos Dados: Se os dados contêm muitos outliers ou são altamente heteroscedásticos (variância dos erros não é constante), a regressão linear pode não ser a melhor escolha, pois esses fatores podem violar as premissas do modelo e levar a estimativas imprecisas.
Variáveis Categóricas com Muitos Níveis: Embora a regressão linear possa lidar com variáveis categóricas ao transformá-las em variáveis dummy, se uma variável categórica contém muitos níveis, isso pode levar a um modelo excessivamente complexo com muitos parâmetros, o que pode resultar em overfitting.
Dependência Temporal: Se os dados são dependentes do tempo (séries temporais), como preços de ações diários, a regressão linear simples pode não ser adequada, pois não capta a dependência entre observações consecutivas.
Então, a regressão linear é uma ferramenta poderosa, mas é crucial entender suas limitações e garantir que as premissas do modelo sejam atendidas antes de aplicá-lo. Em casos onde a regressão linear não é adequada, outras técnicas como regressão logística, modelos de árvores de decisão ou redes neurais podem ser mais apropriadas dependendo da natureza dos dados e do problema.
Um abraço e bons estudos.