Resultado após drop de linhas com NoneType e duplicadas

Solucionado (ver solução)

Importante

Você está vendo a versão anterior da nova experiência da Alura que estamos preparando para você. Em breve, ela ganha uma identidade visual novinha totalmente pensada em potencializar seus estudos!

Solucionado
(ver solução)

1
resposta

Referente ao curso Word2Vec: treinamento de Word Embedding, no capítulo Hiperparâmetros do Word2Vec e atividade Vocabulário e Word2Vec

por Otávio Augusto Cartaxo Araújo

| 380.9k xp | 62 posts

Mid Backend Developer

Olá, eu reparei que antes do drop eu tinha 74.000 linhas, após feito a remoção dos dados irrelevantes fiquei com 70819. Minha dúvida é por que houve essa diferença do que foi apresentado no vídeo. Detalhe, quando li o train.csv existiam 90.000 linhas no dataframe.

1 resposta

solução!

por Thiago G Santos

| 125.2k xp | 134 posts

Instrutor

05/08/2020

Fala Otávio,

Pela sua dúvida vejo duas possibilidades, a primeira é que o seu pré-processamento esteja um pouco diferente e acabou removendo mais informações do que no meu tratamento, tenta dar um ctrl-c ctrl-v na função trata_texto, utilizada no curso e veja se funciona, qualquer coisa cola seu código aqui).

A outra possibilidade que já aconteceu comigo é que lermos o arquivo com pandas.read_csv antes de ter feito o upload completo para as máquinas do google, quando vc for fazer o upload do csv se certifique que ele foi carregado totalmente. Para isso é só acompanhar o upload do arquivo clicando na pasta que fica no canto superior esquedo do colab (onde vc encontra os diretorios da máquina).

Se não der certo, avisa aqui para encontrar o problema juntos!

Abraços e bons estudos!

Importante

Trilhas por carreira

Carreiras de IA

Carreiras de Dados

Carreiras de Cyber

Carreiras de DevOps & Cloud

Carreiras de UX & UI

Carreiras de Mobile & Front-End

Carreiras de Back-End

Carreiras de Negócios

Cursos universitários FIAP

Importante

Tópicos relacionados

Conteúdos Alura com o tema

Trilhas por carreira

Carreiras de IA

Carreiras de Dados

Carreiras de Cyber

Carreiras de DevOps & Cloud

Carreiras de UX & UI

Carreiras de Mobile & Front-End

Carreiras de Back-End

Carreiras de Negócios

Cursos universitários FIAP