3
respostas

Extração e atualização de novos resultados / marcações

Olá,

É possível que ao receber uma quantidade grande de textos (como nas aulas onde estudamos a classificação de uma lista de e-mails) que são atualizados com certa frequência, a minha coluna de resultados (ex.: comercial, financeiro, suporte, etc) seja criada / atualizada de forma dinâmica através de um procedimento que extrai palavras especificas do texto antes de aplicar a classificação? Pergunto pois seria interessante descobrir que novos e-mails pudessem ser respondidos por outros departamentos (ex.: marketing, recursos humanos, compras, etc). Desta forma meu algoritmo poderia evoluir com certa autonomia.

Obrigado.

3 respostas

Bom dia Juliano tudo bem?

Na prática, por baixo dos panos, o "algoritmo treinado" é uma função matemática. Uma vez que f(x) = y, não importa quantas vezes voce rode, f(x) sempre tem que ser y.

Dada essa limitação, o que você precisaria fazer era treinar novamente, agora com as classificações atualizadas, o que te dá um novo algoritmo treinado, isto é, uma nova função, por exemplo g(x), onde g(x) agora é um outro valor qualquer, sem problemas!

[]s

Legal Guilherme, eu posso então armazenar os dados de treinamento em uma base e conforme novas informações forem sendo processadas atualizar esta base de treinamento com as novas informações. Com isso sempre que precisar executar o algoritmo de classificação, ele poderá utilizar esta base atualizada de treinamento.

Com certeza! Você vai perceber que a medida que sua base cresce, "retreinar" fica cada vez mais devagar. Imagina que o youtube (por exemplo) demora 1 semana para treinar o algoritmo de videos similares. Ai entra um video novo, ele teria que retreinar tudo? Entao existem algoritmos que sao feitos (ou adaptados) para atualizar só o que faz sentido, e rodar muito mais rápido quando voce quer só fazer a atualziação. Isso só vai fazer sentido quando demorar o treino. Vai ser uma fase futura, claro.

[]s