Os demais arquivos carregam normalmente, mas ao tentar carregar o arquivo "stackoverflow_espanhol.csv", o pandas apresenta a mensagem de erro:
---------------------------------------------------------------------------
ParserError Traceback (most recent call last)
<ipython-input-13-558ea39fbfcd> in <module>()
1 ## Leitura do dataset ESPANHOL
2
----> 3 dados_espanhol = pd.read_csv("data_sets\stackoverflow_espanhol.csv")
4 dados_espanhol.head()
(...)
ParserError: Error tokenizing data. C error: Expected 3 fields in line 64, saw 6
Aparentemente, o CSV não está formatado corretamente.
RESOLVIDO:
Ao contrário dos demais arquivos, 2 ações foram tomadas:
- Arquivo original foi convertido para "UTF-8" (os demais já estavam em UTF-8);
- Necessário informar o separador como ponto-e-vírgula ";" e não o default "," (os demais estavam com o separador ",")
Assim, o arquivo pode ser lido como:
dados_espanhol = pd.read_csv("data_sets\stackoverflow_espanhol.csv", sep=";")