Diferença no colab e jupyter

Importante

Você está vendo a versão anterior da nova experiência da Alura que estamos preparando para você. Em breve, ela ganha uma identidade visual novinha totalmente pensada em potencializar seus estudos!

1
resposta

por Rubens Sanghikian

| 98.9k xp | 2 posts

Na hora de definir a lista de palavras (lista_tokens = nltk.tokenize.word_tokenize(artigos) lista_palavras = separa_palavras(lista_tokens)), o jupyter retorna um valor maior na lista de 396692. Já chequei cada parte do código, está usando o mesmo texto, a mesma função e mesmo assim retorna diferente. Seria diferença de versão do pacote?

grato

1 resposta

por Thiago G Santos

| 125.2k xp | 134 posts

Instrutor

26/06/2020

Olá Rubens, tudo bem?

Pode ser uma diferença de versão, mas tbm pode ser algo sutil quando se usa o Collab e Júpyter.

Quando rodamos uma célula, todo código nesta célula fica armazenada na memória. As vezes acabamos rodando uma célula e podemos mudar o estado de uma variável sem perceber e acabamos usando essa variável equivocadamente. Tente rodar todas as células em sequência e veja se o erro permanece.

Outro fator pode influênciar é se algum dos métodos use valores aleatórios, se usar você precisa configurar um random seed para garantir a reprodutibilidade dos resultados.

Neste curso nas aulas 1 e 2 fala um pouco sobre o random seed de alguns modelos!

Abraços e bons estudos!

Importante

Trilhas por carreira

Carreiras de IA

Carreiras de Dados

Carreiras de Cyber

Carreiras de DevOps & Cloud

Carreiras de UX & UI

Carreiras de Mobile & Front-End

Carreiras de Back-End

Carreiras de Negócios

Cursos universitários FIAP

Importante

Tópicos relacionados

Conteúdos Alura com o tema

Trilhas por carreira

Carreiras de IA

Carreiras de Dados

Carreiras de Cyber

Carreiras de DevOps & Cloud

Carreiras de UX & UI

Carreiras de Mobile & Front-End

Carreiras de Back-End

Carreiras de Negócios

Cursos universitários FIAP