2
respostas

O arquivo de dados do exercício não está disponível (mas posso providenciar)

Bom dia:

No vídeo o instrutor cita a utilização de um data set simplificado para a realização do exercício, e na descrição do mesmo tem o seguinte texto:

Haverá um novo data set simplificado, e um processo mais reduzido, porém as principais partes estarão disponíveis.

Entretanto, o arquivo .zip disponibilizado não conta com o data set indicado, conforme outros alunos já citaram: aqui, aqui, aqui, aqui e aqui. Alguns alunos estão sem resposta até hoje, e outros receberam uma resposta atravessada.

E o link disponível no site, que consta no Jupyter notebook (este), não é o real, pois o instrutor removeu colunas (de 16 ficaram 7) e linhas (de 500.000 para apenas 1.000), alterou os nomes das colunas e converteu o caracter separador no .csv.

É possível desenvolver o projeto usando o data set original? SIM, mas não é o que se vê no vídeo de apresentação do exercício nem nos comentários no Jupyter. E precisa de uns truques adicionais.

É possível publicar um link para um data set reduzido na descrição do vídeo para ninguém mais se incomodar com isto aqui no fórum? DÁ TAMBÉM. Se o instrutor perdeu o arquivo utilizado, me mandem um e-mail que passo o data set que eu reduzi para fazer o exercício, e aí vocês compartilham com os outros alunos.

O que não dá é para deixar um monte de alunos questionando no fórum sem resolver o problema de vez, né? ;-)

2 respostas

Olá Taciano,

Agradeço pela informação! Não tinha percebido que o problema estava no conteúdo do dataset.

Eu estou verificando essa aula para identificar os problemas e tentar corrigir. Compartilha por favor o seu dataset corrigido por um link do Google Drive ou por onde for mais fácil.

Olá, Lucas:

Tente este dataset: https://drive.google.com/open?id=1htXiCRo8SO8VVd6QX2d5HDX3SzVfYnRG

Acredito que resolverá o problema.