1
resposta

Estamos re treinando o model quando usando a mesma regressão logítisca?

No minuto 12 o professor treina a mesma regressão logística utilizada anteriormente para treinar os dados separados de uma forma diferente.

Gostaria de saber se isso não é um problema. Pois, penso que se não declararmos novamente a regressão logística está utilizando um modelo já treinado com os últimos dados. Sendo assim, seria impossível inferir se a acurácia do método tfidf é melhor que a usada anteriormente.

1 resposta

Oi Estevan! Tudo bem com você? Espero que sim!

Desculpa pela demora em te dar um retorno.

A variável regressao_logistica é atribuada ao método de classificação LogisticRegression do seguinte modo:

from sklearn.linear_model import LogisticRegression

regressao_logistica = LogisticRegression(solver = "lbfgs")

Essa atribuição permitiu utilizar o classificador LogisticRegression e todos os seus métodos inclusos, como o fit e o score pela variável regressao_logistica. Ou seja, regressao_logistica é o próprio classificador e não o resultado da classificação.

No entanto, quando se utiliza o método .fit o classificador faz todo o aprendizado com os dados recebidos nos parâmetros e se auto retorna um modelo treinado. Como o professor ajustou o modelo com .fit e os parâmetros de treino do método tfidf em cada teste, o modelo se reajustou para aqueles novos dados permitindo que aquela inferência pudesse ser encontrada.

Eu espero ter te ajudado! Se surgir outra dúvida estarei à disposição ;-)

Bons estudos!

Caso este post tenha lhe ajudado, por favor, marcar como solucionado ✓. Bons Estudos!