Bom dia:
No vídeo o instrutor cita a utilização de um data set simplificado para a realização do exercício, e na descrição do mesmo tem o seguinte texto:
Haverá um novo data set simplificado, e um processo mais reduzido, porém as principais partes estarão disponíveis.
Entretanto, o arquivo .zip
disponibilizado não conta com o data set indicado, conforme outros alunos já citaram: aqui, aqui, aqui, aqui e aqui. Alguns alunos estão sem resposta até hoje, e outros receberam uma resposta atravessada.
E o link disponível no site, que consta no Jupyter notebook (este), não é o real, pois o instrutor removeu colunas (de 16 ficaram 7) e linhas (de 500.000 para apenas 1.000), alterou os nomes das colunas e converteu o caracter separador no .csv
.
É possível desenvolver o projeto usando o data set original? SIM, mas não é o que se vê no vídeo de apresentação do exercício nem nos comentários no Jupyter. E precisa de uns truques adicionais.
É possível publicar um link para um data set reduzido na descrição do vídeo para ninguém mais se incomodar com isto aqui no fórum? DÁ TAMBÉM. Se o instrutor perdeu o arquivo utilizado, me mandem um e-mail que passo o data set que eu reduzi para fazer o exercício, e aí vocês compartilham com os outros alunos.
O que não dá é para deixar um monte de alunos questionando no fórum sem resolver o problema de vez, né? ;-)