1
resposta

Word2vec palavras catalogadas

Boa tarde

No word2vec, os argumentos da most_similar tem que ser necessariamente palavras cadastradas no modelo que serve de input pro modelo, né?

1 resposta

Olá, estava com essa mesma dúvida e procurando sobre o modelo entendi que para esse most_similar transforma a palavra que você passa em um vetor e após isso ele faz uma comparação com as outras, sendo assim vale qualquer palavra que você colocar lá, porém, se você coloca palavras tipo "auihsdfphsdu" ele vai transformar em um vetor "esquisito" que os valores de similaridade que ele encontra não são suficientemente bons pra falar que é similar, então ele fala que está fora do vocabulário.