Se puderem me esclarecer um pouco melhor a utilidade do index na nossa formula
Você está vendo a versão anterior da nova experiência da Alura que estamos preparando para você. Em breve, ela ganha uma identidade visual novinha totalmente pensada em potencializar seus estudos!
Se puderem me esclarecer um pouco melhor a utilidade do index na nossa formula
Olá, Lúcio, tudo bem?
Acredito que você esteja falando do caso da aula Iterando com Dataframes, correto?
Partindo para a nossa dúvida, o professor nos explica uma forma de fazer iteração em nosso Dataframe usando um método chamado iterrows(), que ajuda a criar um iterador. Aliado ao uso de list(), através do código list(dataset.iterrows()) criamos uma lista com diversas tuplas, onde cada uma delas tem o nosso índice (index) descrevendo o nome dos veículos e uma series com as outras informações a respeito desse veículo.
Na imagem abaixo podemos notar um retângulo vermelho que descreve o nosso index e um reta azul com a seta da esquerda apontando o tipo de informação que estamos descrevendo e a da esquerda apontado para o valor dessa informação para o veículo que estamos observando.
Esse processo é utilizado para explicar como o dado é mostrado para nós quando usamos o iterrows().
Então, para que utilizamos esse método e como o index é útil aqui?
Pelo formato que notamos de nosso iterador dataset.iterrows() podemos utilizar um for para desempacotar essas tuplas em duas variáveis:
Se notarmos o código explicado pelo professor, vemos que ele pega o index e o row dos dados de nosso dataset e aplica uma condição de que se o ano do nosso veículo é diferente de 2019, iremos adicionar a média de quilometragem no nosso dataset dividindo a quilometragem lida da series pela diferença dos anos também lida na séries . O uso do index define qual veículo estamos lendo e o row qual série iremos ler e manipular o valor.
for index, row in dataset.iterrows():
if(2019 - row['Ano'] != 0):
dataset.loc[index, 'Km_media'] = row['Quilometragem'] / (2019 - row['Ano'])
else:
dataset.loc[index, 'Km_media'] = 0
datasetÉ possível perceber que carros fabricado em 2019 teram a quilometragem média de 0.
Essa é uma das formas de agilizar o calculo dos quilômetros rodados de cada veículo do nosso conjunto utilizando as iterações em dataframes.
Esperamos ter respondido a sua pergunta e qualquer dúvida é só chamar!
Forte abraço!