1
resposta

Diferença no colab e jupyter

Na hora de definir a lista de palavras (lista_tokens = nltk.tokenize.word_tokenize(artigos) lista_palavras = separa_palavras(lista_tokens)), o jupyter retorna um valor maior na lista de 396692. Já chequei cada parte do código, está usando o mesmo texto, a mesma função e mesmo assim retorna diferente. Seria diferença de versão do pacote?

grato

1 resposta

Olá Rubens, tudo bem?

Pode ser uma diferença de versão, mas tbm pode ser algo sutil quando se usa o Collab e Júpyter.

Quando rodamos uma célula, todo código nesta célula fica armazenada na memória. As vezes acabamos rodando uma célula e podemos mudar o estado de uma variável sem perceber e acabamos usando essa variável equivocadamente. Tente rodar todas as células em sequência e veja se o erro permanece.

Outro fator pode influênciar é se algum dos métodos use valores aleatórios, se usar você precisa configurar um random seed para garantir a reprodutibilidade dos resultados.

Neste curso nas aulas 1 e 2 fala um pouco sobre o random seed de alguns modelos!

Abraços e bons estudos!