Aplicação TF-IDF produção

Solucionado (ver solução)

Importante

Você está vendo a versão anterior da nova experiência da Alura que estamos preparando para você. Em breve, ela ganha uma identidade visual novinha totalmente pensada em potencializar seus estudos!

Solucionado
(ver solução)

1
resposta

Referente ao curso NLP: regex e modelos de linguagem

por Pablo Felix da Silva

| 208.2k xp | 2 posts

Pelo que entendi quando aplicamos a vetorização e selecionamos os termos mais relevantes como no caso do TFIDF esses termos ficam na "raiz" do nosso modelo salvo, certo? Minha dúvida é qnt a aplicação em produção, vou aplicar o TF-IDF nos dados de produção antes de olhar para o modelo, e muito provavelmente os termos escolhidos serão outros, inclusive com outros "pesos" para cada termo, existe uma forma de corrigir isso (talvez selecionando apenas os termos do modelo), ou no geral é algo que não tem muita influência visto quem o treino tende a espelhar a base?

1 resposta

solução!

por Thiago G Santos

| 125.2k xp | 134 posts

Instrutor

15/06/2020

Fala Pablo, tudo bem?

Sim os pesos e termos vão fazer parte do seu vocabulário, então com a evolução dos seus dados você precisa retreinar seu modelo para melhorar os pesos e vocabulário!

O que você precisa é pensar bem em como treinar seu modelo, a pergunta aqui é! Quais são os dados que realmente fazem sentido para o contexto da minha aplicação?

Se sua aplicação precisa classificar avaliações de produtos eletrônicos, você não vai treinar seu TF-IDF com avaliações de filmes! Entretanto, mesmo que vc utilize muitos e muitos dados, ainda sim seu modelo precisa ser atualizado com o tempo, poís a linguagem humana é algo vivo, de tempos em tempos aprendemos novas palavras e usamos outros termos para nos expressar!

Abraços e bons estudos!

Importante

Trilhas por carreira

Carreiras de IA

Carreiras de Dados

Carreiras de Cyber

Carreiras de DevOps & Cloud

Carreiras de UX & UI

Carreiras de Mobile & Front-End

Carreiras de Back-End

Carreiras de Negócios

Cursos universitários FIAP

Importante

Tópicos relacionados

Conteúdos Alura com o tema

Trilhas por carreira

Carreiras de IA

Carreiras de Dados

Carreiras de Cyber

Carreiras de DevOps & Cloud

Carreiras de UX & UI

Carreiras de Mobile & Front-End

Carreiras de Back-End

Carreiras de Negócios

Cursos universitários FIAP