Eu fiz meu projeto usando Pipeline do sklearn e no final não prever os dados por causa das mudanças e gostaria de compartilhar o meu colab:
https://drive.google.com/file/d/1i93QYjywD_cV0MCrCKm1Ca9X3qe9pyNT/view?usp=sharing
Você está vendo a versão anterior da nova experiência da Alura que estamos preparando para você. Em breve, ela ganha uma identidade visual novinha totalmente pensada em potencializar seus estudos!
Eu fiz meu projeto usando Pipeline do sklearn e no final não prever os dados por causa das mudanças e gostaria de compartilhar o meu colab:
https://drive.google.com/file/d/1i93QYjywD_cV0MCrCKm1Ca9X3qe9pyNT/view?usp=sharing
Ei, William! Tudo bem?
Não conseguir entender muito bem qual é a sua dúvida, poderia trazer mais detalhes por gentileza?
Fico no aguardo. Bons estudos!
na parte final da aula 5 na hora de usar o modelo escolhido para fazer previsões no novo DataFrame.
Ei, William! Obrigada por retornar.
Como você usou um Pipeline, o modelo salvo espera receber os dados no mesmo formato original, ou seja:
antes de qualquer pré-processamento.
exatamente com as mesmas colunas de X_treino / X_teste.
Isso porque o preprocessor faz parte do pipeline e será aplicado automaticamente no .predict().
**Boas práticas para prever os novos dados: **
Basta garantir que os novos dados estejam em um DataFrame com:
mesmas colunas;
mesmos nomes;
mesmos tipos;
Não aplique o preprocessor manualmente antes do .predict(). O erro mais comum é tentar usar dados já transformados.
Espero ter ajudado e qualquer dúvida, conte conosco aqui no fórum.
Até mais!
Caso este post tenha lhe ajudado, por favor, marcar como solucionado!