1
resposta

Fazendo previsões com mais dados

No exemplo dado em aula, nº de passageiros x tempo, a previsão realizada leva em consideração os dados já existentes na base original. A base vai até o ano de 1960. O modelo faz a regressão e compara com os dados originais para verificar quão assertiva foi a previsão.

Caso eu queira utilizar o mesmo modelo para prever os nº de passageiros até os dias de hoje, por exemplo, como deveria proceder? Será necessário adicionar a base original os dados de passageiros x tempo referentes a todos os anos entre 1960 e 2020 ou existe uma forma do modelo fazer a previsão se apenas darmos o tempo?

Não sei se a minha dúvida ficou clara...mas é algo que ainda não consegui compreender assistindo aos vídeos.

Obrigado

1 resposta

E aí, Luis. Tudo certo?

Quando nós usamo um modelo de regressão, geralmente a intenção é prever o futuro com base no que já conhecemos do passado. Pensando por esse lado, sim, da pra prever os número de passageiros de hoje usando o mesmo modelo que só conhece a realidade de 60 anos atrás. O problema disso é que nós vamos ignorar todas as questões contextuais como melhoras ou pioras abruptas na economia, crises como a que rolou depois do 11/9 com a industria dos vôos domésticos ou mesmo essa pandemia, porque a previsão não vai ter a referência do valor real num período próximo pra servir como um norte.

O que rola na prática é que, pra diminuir esse erro por falta de informação, quanto mais informação e quanto mais recente melhor, e os dados já passam por um funil onde essas métricas são frequentemente avaliadas. Vai ter aplicação que roda de boa com esse processo de novos treinos acontecendo de 6 em 6 meses e vai ter aplicação que precisa de uma dinâmica muito mais acelerada. O que vai definir isso é o custo de conseguir e gerenciar esses dados, o retorno que isso traz e as métricas de desempenho.

Espero ter entendido a pergunta e ajudado um pouco.

Abraço,