1
resposta

Por que usando o boxplot do matplotlib a tabela do csv só começa a ser lido a partir da linha 0 e não da linha inicia da tabela?

Estava fazendo o curso de Analise e visualização de dados e durante o curso foi explicado as graficos utilizando pandas(pd), seaborn(sns) e matplotlib(plt). Mas estou utilizando um CSV que é iniciado a partir da linha 1 e não da linha 0, e quando solicitei um boxplot plt ele dava um erro, entregando que não podia gerar esse grafico pois o csv não continha dados na layer 0, por que isso acontece?

1 resposta

Oi, Vinicius! Tudo certo?

Esse problema geralmente ocorre devido ao padrão de leitura realizado por essas bibliotecas, que começa a partir da linha 0 do arquivo CSV. Isso é algo bastante comum em diversas tecnologias.

No entanto, se o seu arquivo CSV começa, de fato, a partir da linha 1, você pode ajustar isso na hora de ler o arquivo, utilizando o parâmetro skiprows da função read_csv do Pandas, assim como ilustro no exemplo abaixo:

import pandas as pd

dados = pd.read_csv('arquivo.csv', skiprows=1)

Neste contexto, a função read_csv irá pular a primeira linha do arquivo e começar a leitura a partir da linha 1.

Depois disso, você pode trabalhar normalmente com o DataFrame criado!

Outro caminho que você pode seguir, antes de importar sua base de dados, é reorganizar o arquivo CSV — de modo que ele se adeque às convenções encontradas quando lidamos com Python e Análise de Dados.

Vini, essas são apenas algumas dicas para a resolução do problema que você está enfrentando. Como é um assunto externo ao curso e eu não tenho acesso ao cenário completo do seu projeto (principalmente da estrutura do seu CSV), outros testes terão de ser feitos a fim de obter o resultado esperado.

Um abraço!