Importante

Você está vendo a versão anterior da nova experiência da Alura que estamos preparando para você. Em breve, ela ganha uma identidade visual novinha totalmente pensada em potencializar seus estudos!

1
resposta

Word2vec palavras catalogadas

Boa tarde

No word2vec, os argumentos da most_similar tem que ser necessariamente palavras cadastradas no modelo que serve de input pro modelo, né?

1 resposta

Olá, estava com essa mesma dúvida e procurando sobre o modelo entendi que para esse most_similar transforma a palavra que você passa em um vetor e após isso ele faz uma comparação com as outras, sendo assim vale qualquer palavra que você colocar lá, porém, se você coloca palavras tipo "auihsdfphsdu" ele vai transformar em um vetor "esquisito" que os valores de similaridade que ele encontra não são suficientemente bons pra falar que é similar, então ele fala que está fora do vocabulário.