Solucionado (ver solução)
Solucionado
(ver solução)
2
respostas

Dúvida

Olá, boa tarde

Fiquei em dúvida no código abaixo:

ajustando o modelo com a pipeline

dt_model = pipeline.fit(train)

Tinha entendido que antes do fit, eu usaria uma variável que tinha como entrada um algoritmo, como por exemplo Random Forest, mas aqui foi utilizado o pipeline que recebe uma sequência de eventos. Não entendi quando uso o algoritmo e quando uso o pipeline.

Obrigado

2 respostas
solução!

Olá Luciano,

pelo que eu entendi, você ficou na dúvida se aplicaria o .fit apenas no tipo de algoritmo (random forest, reg log, decision tree ...) ou na pipeline de uma sequência de outros passos, é isso?

Se essa for sua dúvida, no caso desse problema, unimos todas as transformações dos dados juntamente com o tipo de algoritmo no pipeline para ajustar o modelo, esses passos poderiam ter sido separados, mas de forma conjunta ele facilita etapas posteriores, como a classificação de uma frase que não está na base, uma nova observação.

No caso de uma nova observação, podemos aplicar todos as transformações juntamente com o algoritmo para assim conseguir categorizar obedecendo os processamentos feitos no conjunto de dados treinado.

Espero ter ajudado. Bons estudos

Bom dia Ana.

Era essa dúvida. Me ajudou bastante, muito obrigado.

Att Luciano