Se puderem me esclarecer um pouco melhor a utilidade do index na nossa formula
Se puderem me esclarecer um pouco melhor a utilidade do index na nossa formula
Olá, Lúcio, tudo bem?
Acredito que você esteja falando do caso da aula Iterando com Dataframes, correto?
Partindo para a nossa dúvida, o professor nos explica uma forma de fazer iteração em nosso Dataframe usando um método chamado iterrows()
, que ajuda a criar um iterador. Aliado ao uso de list()
, através do código list(dataset.iterrows())
criamos uma lista com diversas tuplas, onde cada uma delas tem o nosso índice (index
) descrevendo o nome dos veículos e uma series com as outras informações a respeito desse veículo.
Na imagem abaixo podemos notar um retângulo vermelho que descreve o nosso index e um reta azul com a seta da esquerda apontando o tipo de informação que estamos descrevendo e a da esquerda apontado para o valor dessa informação para o veículo que estamos observando.
Esse processo é utilizado para explicar como o dado é mostrado para nós quando usamos o iterrows()
.
Então, para que utilizamos esse método e como o index é útil aqui?
Pelo formato que notamos de nosso iterador dataset.iterrows()
podemos utilizar um for
para desempacotar essas tuplas em duas variáveis:
Se notarmos o código explicado pelo professor, vemos que ele pega o index
e o row
dos dados de nosso dataset
e aplica uma condição de que se o ano do nosso veículo é diferente de 2019, iremos adicionar a média de quilometragem no nosso dataset
dividindo a quilometragem lida da series pela diferença dos anos também lida na séries . O uso do index
define qual veículo estamos lendo e o row
qual série iremos ler e manipular o valor.
for index, row in dataset.iterrows():
if(2019 - row['Ano'] != 0):
dataset.loc[index, 'Km_media'] = row['Quilometragem'] / (2019 - row['Ano'])
else:
dataset.loc[index, 'Km_media'] = 0
dataset
É possível perceber que carros fabricado em 2019 teram a quilometragem média de 0.
Essa é uma das formas de agilizar o calculo dos quilômetros rodados de cada veículo do nosso conjunto utilizando as iterações em dataframes.
Esperamos ter respondido a sua pergunta e qualquer dúvida é só chamar!
Forte abraço!