Solucionado (ver solução)
Solucionado
(ver solução)
4
respostas

Função .read_csv(url, separador), duvida do separador

Olá Colegas,

Vendo o vídeo não ficou claro pra mim se o tipo do separador a ser explicitado na sintaxe é o que foi usado no arquivo .csv ou se é o usado no Colab. O padrão do csv é separar os valores com vírgula, mas pelo que pesquisei e entendi, parece que é possível usar outros sinalizadores, daí a minha dúvida.

4 respostas
solução!

Olá Gabriel, O separador que deve ser indicado é aquele que está sendo usado pelo arquivo .csv, assim o pandas conseguirá idendificar as colunas corretamente. Como você mesmo disse, o padrão é a "vírgula" como separador, mas existem muitos arquivos ".csv" que utilizam outros caracteres para separar os valores ("espaço", "_", "-" e outros). Abraço!

Não ficou claro para mim, onde que fica definido esse separador? Esse separador é usados somente para colunas?

Oi,

Veja o exemplo abaixo.

Note que a primeira linha é o nome das colunas e as linhas subsequentes são os registros. Nesse exemplo nós temos três colunas:"Nome", "Idade", "Cor Preferida" e a informação de cada coluna está separada por virgulas (o padrão).

Nome,Idade,CorPreferida
Kaio,25,Azul
Fabio,45,Amarelo

Mas também é possível fazer a separação dos valores usando outros caracteres, como o "ponto e vírgula":

Nome;Idade;CorPreferida
Kaio;25;Azul
Fabio;45;Amarelo

Ou qualquer outro caracter:

Nome_Idade_CorPreferida
Kaio_25_Azul
Fabio_45_Amarelo

Assim, quando o caracter usado para separação dos valores for diferente de vírgula, devemos indicar na opção sep=";"

Fico a disposição!

Oi Joamir,

Se entendi direito sua dúvida esta relacionada a natureza de um arquivo de extensão csv (comma separeted value). É um tipo de extensão mais primitiva, usando o excel para exemplificar:

Quando você separa 2 valores por uma virgula em um arquivo .csv, é como se você estive colocando uma informação na coluna A e outra na coluna B, para descer para a segunda linha você usa o enter. Então de forma bem grosseira, "virgula = próximaColuna" e "enter=próxima linha".