Solucionado (ver solução)
Solucionado
(ver solução)
1
resposta

Função padded_everygram_pipeline

Estava com um pouco de duvida relacionado ao segundo retorno da função padded_everygram_pipeline. O primero entendi que são so n-gramas das sentenças passadas como parametro, porém o segundo tive um pouco de duvida mas cheguei a uma conclusão que nao sei se é a correta. O segundo parametro retornado pela função seria os vocabulos das sentenças passadas como parametro? Por exemplo caso passemos varias sentenças, serão retornadas as palavras dessas sentenças, já caso passemos varias palavras(como feito no curso), serão retornadas varias letras dessas palavras?

1 resposta
solução!

Sim Matheus, irá gerar o vocabulário já com os fake chars. Único ponto, se você passar apenas o texto e não uma lista de palavras o fake char, será adicionado a cada caracter (se for bgram a cada 2 caracteres).

Quer mergulhar em tecnologia e aprendizagem?

Receba a newsletter que o nosso CEO escreve pessoalmente, com insights do mercado de trabalho, ciência e desenvolvimento de software