Solucionado (ver solução)
Solucionado
(ver solução)
1
resposta

Não entendi a funcionalidade do Index

Se puderem me esclarecer um pouco melhor a utilidade do index na nossa formula

1 resposta
solução!

Olá, Lúcio, tudo bem?

Acredito que você esteja falando do caso da aula Iterando com Dataframes, correto?

Partindo para a nossa dúvida, o professor nos explica uma forma de fazer iteração em nosso Dataframe usando um método chamado iterrows(), que ajuda a criar um iterador. Aliado ao uso de list(), através do código list(dataset.iterrows()) criamos uma lista com diversas tuplas, onde cada uma delas tem o nosso índice (index) descrevendo o nome dos veículos e uma series com as outras informações a respeito desse veículo.

Na imagem abaixo podemos notar um retângulo vermelho que descreve o nosso index e um reta azul com a seta da esquerda apontando o tipo de informação que estamos descrevendo e a da esquerda apontado para o valor dessa informação para o veículo que estamos observando.

 

Imagem do list(dataset.iterrows()) aplicado ao nosso dataset aperesentando uma lista de tuplas com o index representado pelo retângulo vermelho e uma reta azul com a seta da esquerda apontando o tipo de informação que estamos descrevendo e a da esquerda apontado para o valor dessa informação para o veículo que estamos observando.

 

Esse processo é utilizado para explicar como o dado é mostrado para nós quando usamos o iterrows().

Então, para que utilizamos esse método e como o index é útil aqui?

Pelo formato que notamos de nosso iterador dataset.iterrows() podemos utilizar um for para desempacotar essas tuplas em duas variáveis:

  • index, que é o índice de nossos dados ou, no nosso caso, o nome dos veículos.
  • row, que é a series com todos os dados pertencentes ao veículo.

Se notarmos o código explicado pelo professor, vemos que ele pega o index e o row dos dados de nosso dataset e aplica uma condição de que se o ano do nosso veículo é diferente de 2019, iremos adicionar a média de quilometragem no nosso dataset dividindo a quilometragem lida da series pela diferença dos anos também lida na séries . O uso do index define qual veículo estamos lendo e o row qual série iremos ler e manipular o valor.

for index, row in dataset.iterrows():
  if(2019 - row['Ano'] != 0):
    dataset.loc[index, 'Km_media'] = row['Quilometragem'] / (2019 - row['Ano'])
  else:
    dataset.loc[index, 'Km_media'] = 0

dataset

É possível perceber que carros fabricado em 2019 teram a quilometragem média de 0.

Essa é uma das formas de agilizar o calculo dos quilômetros rodados de cada veículo do nosso conjunto utilizando as iterações em dataframes.

Esperamos ter respondido a sua pergunta e qualquer dúvida é só chamar!

Forte abraço!

Caso este post tenha lhe ajudado, por favor, marcar como solucionado ✓.Bons Estudos!

Quer mergulhar em tecnologia e aprendizagem?

Receba a newsletter que o nosso CEO escreve pessoalmente, com insights do mercado de trabalho, ciência e desenvolvimento de software