Solucionado (ver solução)
Solucionado
(ver solução)
3
respostas

[Dúvida] Pipeline

Eu fiz meu projeto usando Pipeline do sklearn e no final não prever os dados por causa das mudanças e gostaria de compartilhar o meu colab:

https://drive.google.com/file/d/1i93QYjywD_cV0MCrCKm1Ca9X3qe9pyNT/view?usp=sharing

3 respostas

Ei, William! Tudo bem?

Não conseguir entender muito bem qual é a sua dúvida, poderia trazer mais detalhes por gentileza?

  • Em qual parte do projeto você está se referindo?
  • Qual aula é?
  • Qual problema está tendo? É em qual código?

Fico no aguardo. Bons estudos!

na parte final da aula 5 na hora de usar o modelo escolhido para fazer previsões no novo DataFrame.

solução!

Ei, William! Obrigada por retornar.

Como você usou um Pipeline, o modelo salvo espera receber os dados no mesmo formato original, ou seja:

  • antes de qualquer pré-processamento.

  • exatamente com as mesmas colunas de X_treino / X_teste.

Isso porque o preprocessor faz parte do pipeline e será aplicado automaticamente no .predict().

**Boas práticas para prever os novos dados: **

Basta garantir que os novos dados estejam em um DataFrame com:

  • mesmas colunas;

  • mesmos nomes;

  • mesmos tipos;

Não aplique o preprocessor manualmente antes do .predict(). O erro mais comum é tentar usar dados já transformados.

Espero ter ajudado e qualquer dúvida, conte conosco aqui no fórum.

Até mais!

Caso este post tenha lhe ajudado, por favor, marcar como solucionado!