Oii, Jorge! Tudo bem?
O erro "BadZipFile: File is not a zip file" geralmente indica que o arquivo que você está tentando ler não está no formato esperado pelo pandas
.
Como o arquivo contendo o conjunto de dados é muito grande, após abrir e fechar o Google Colab seria preciso fazer um novo upload dos dados, evitando assim erros de carregamento.
Neste caso, sugiro que você faça o upload da base de dados no Google Drive, para que o carregamento no colab seja mais prático e eficiente.
Para isso, na sua página do Google, clique no menu chamado Google Apps. Abrirá uma janela com várias opções, selecione o Drive:
- Em seguida, na página do Google Drive, clique na opção + Novo na lateral esquerda superior da tela. Escolha a opção Upload de arquivo.
- Após clicar para fazer o upload, abrirá uma janela do explorador de arquivos para você buscar a base de dados que baixou, geralmente se encontra no diretório de Downloads. Selecione a base de dados e clique em Abrir para realizar o upload:
Pronto, sua base de dados está no drive. A partir daqui, você pode seguir os passos da aula Leitura dos dados a partir do minuto 1:14.
E, Jorge, toda vez que você abrir o Colab, repita esse processo de conectar o google drive desta aula para que o código de leitura seja carregado corretamente.
Caso esteja, fazendo com o upload do arquivo diretamente no Colab, tenha certeza que o processo de carregamento tenha sido finalizado:
Ao realizar as etapas, e conectar o drive toda vez que começar os estudos, será possível seguir com o projeto sem erros.
Espero ter ajudado. Qualquer dúvida, conte conosco.
Bons estudos, Jorge!