1
resposta

Professor descreve arquivo ratins.csv como 759megas

No video, na posicao 3:30 o professor faz o upload do arquivo ratings.csv que contem 759,2mb. Fiz o download no site movielens (https://files.grouplens.org/datasets/movielens/ml-latest-small.zip) e o arquivo ratings.csv possue somente 2.426mb.

Pq existe essa diferenca tão grande entre os arquivos?

1 resposta

Olá Antônio, tudo bem? Espero que sim!

No site de download do MovieLens, temos a opção de baixar uma vesão reduzida e uma completa dos dados. A versão reduzida terá menos registros e por isso ela tem um tamanho muito menor. Isso não vai impactar no aprendizado do curso, uma vez que os procedimentos adotados serão os mesmos. Mas talvez haja uma diferença nos resultados obtidos quando utilizada uma base de dados maior ou menor.

Na Atividade 03 da Aula 01 - Baixando os dados, indica que você pode escolher a versão ml-latest-small para trabalhar com um conjunto de dados reduzido ou ml-latest para o conjunto maior.

Espero que tenha tirado sua dúvida.

Estou à disposição. Bons estudos!