1
resposta

Utilizar os modelos do curso com outro dataset

Olá,

Segui os passos do curso, usando um dataset de produtos. A idéia seria identificar a similaridade de produtos, mas por que quando digito alguns termos, ele não encontra nenhum termo similar?:

Termo que funcionou

termo que não funcionou

1 resposta

Oii, Fernanda! Tudo bem?

Isso pode estar acontecendo por vários motivos, por exemplo, devido à qualidade do dataset ou pela falta de similaridade entre os termos esteja relacionada com a quantidade de treinamento.

O Word2Vec, é treinado para identificar as relações de similaridade entre as palavras com base no contexto e se elas não estão aparecendo, pode ser que o modelo não as consideram similares.

Uma sugestão para solucionar é verificar se os termos estão no dataset e se são considerados similares, use os vetores para calcular a similaridade e revisar se estão próximos uns dos outros.

Outra sugestão é usar o mesmo dataset que o Instrutor usa e disponibiliza, pelo menos nesse primeiro momento de aprendizado.

Continue dedicando aos estudos e qualquer dúvida, conte com a gente!

Bons estudos, Fernanda!