Solucionado (ver solução)
Solucionado
(ver solução)
1
resposta

Erro ao executar dataset[['Quilometragem', 'Valor']].describe()

Ao tentar executar a linha acima no colab é exibido este erro

---------------------------------------------------------------------------
KeyError                                  Traceback (most recent call last)
<ipython-input-30-043c9ac1f54f> in <module>()
----> 1 dataset[['Quilometragem', 'Valor']].describe()

2 frames
/usr/local/lib/python3.7/dist-packages/pandas/core/indexing.py in _validate_read_indexer(self, key, indexer, axis, raise_missing)
   1296             if missing == len(indexer):
   1297                 axis_name = self.obj._get_axis_name(axis)
-> 1298                 raise KeyError(f"None of [{key}] are in the [{axis_name}]")
   1299 
   1300             # We (temporarily) allow for some missing keys with .loc, except in

KeyError: "None of [Index(['Quilometragem', 'Valor'], dtype='object')] are in the [columns]"

notei que ao abrir o cvs no colab a formatação ficou estranha sendo apresentado assim:

Nome;Motor;Ano;Quilometragem;Zero_km;Acessórios;Valor
0    Jetta Variant;Motor 4.0 Turbo;2003;44410;False...
1    Passat;Motor Diesel;1991;5712;False;['Central ...
2    Crossfox;Motor Diesel V8;1990;37123;False;['Pi...
3    DS5;Motor 2.4 Turbo;2019;;True;['Travas elétri...
4    Aston Martin DB4;Motor 2.4 Turbo;2006;25757;Fa...
5    Palio Weekend;Motor 1.8 16v;2012;10728;False;[...

Sendo que no vídeo do professor a formatação do output fica bem bonitinha, precisei adicionar o parâmetro

dataset = pd.read_csv('db.csv', sep =' ; ', engine= 'python')

pois antes também estava exibindo erro apenas com o parametro do arquivo e do separador. Podem me ajudar?

1 resposta
solução!

Oi, Juliana! Como você está?

Acredito que esse erro esteja ocorrendo, porque ao tentar abrir seu arquivo .csv você está usando o seguinte separador sep = ' ; ', com espaço + ; + espaço entre aspas. O correto é que você coloque apenas o ";" entre as aspas, sem esses espaços. Isso porque, se você acrescenta esses espaços, a função read_csv vai procurar como separador de colunas do seu arquivo csv tanto os espaços quando o ponto e vírgula.

Portanto, o correto seria assim:

import pandas as pd
dataset = pd.read_csv('db.csv', sep =';')

Tenta fazer dessa forma pra gente ver se funciona :)

Qualquer dúvida estarei por aqui, tá bom?