Solucionado (ver solução)
Solucionado
(ver solução)
1
resposta

Resultado após drop de linhas com NoneType e duplicadas

Olá, eu reparei que antes do drop eu tinha 74.000 linhas, após feito a remoção dos dados irrelevantes fiquei com 70819. Minha dúvida é por que houve essa diferença do que foi apresentado no vídeo. Detalhe, quando li o train.csv existiam 90.000 linhas no dataframe.

1 resposta
solução!

Fala Otávio,

Pela sua dúvida vejo duas possibilidades, a primeira é que o seu pré-processamento esteja um pouco diferente e acabou removendo mais informações do que no meu tratamento, tenta dar um ctrl-c ctrl-v na função trata_texto, utilizada no curso e veja se funciona, qualquer coisa cola seu código aqui).

A outra possibilidade que já aconteceu comigo é que lermos o arquivo com pandas.read_csv antes de ter feito o upload completo para as máquinas do google, quando vc for fazer o upload do csv se certifique que ele foi carregado totalmente. Para isso é só acompanhar o upload do arquivo clicando na pasta que fica no canto superior esquedo do colab (onde vc encontra os diretorios da máquina).

Se não der certo, avisa aqui para encontrar o problema juntos!

Abraços e bons estudos!

Quer mergulhar em tecnologia e aprendizagem?

Receba a newsletter que o nosso CEO escreve pessoalmente, com insights do mercado de trabalho, ciência e desenvolvimento de software