Olá, estou tentando fazer um trabalho relativamente simples para trabalhar o que aprendi até agora na formação "Python para Data Science".
Sou fã de Formula 1 também, então uni as duas coisas.
Estou tentando fazer um gráfico simples que relaciona a volta mais rápida de um certo circuito.
Os dados que consegui no Kaggle reúnem os dados da F1 desde 1950 até o presente ano, 2020. Creio que por conta disso, são vários arquivos .csv (pilotos, circuitos, corridas, qualificações, times, etc.).
Já consegui filtrar bastante coisa, tenho no DataFrame que quero trabalhar encima somente as voltas mais rápidas. Porém, preciso das voltas mais rápidas de um determinado circuito.
E também já consegui filtrar todos os IDs das corridas desse determinado circuito, que é o dado que preciso para conseguir somente as voltas mais rápidas. Porém consegui esses dados em um DataFrame diferente do que preciso trabalhar.
Minha pergunta é: como posso relacionar essas duas colunas desses dois DataFrames diferentes?
(deixarei meu código abaixo, creio que ficará mais claro com o código)
import pandas as pd
import matplotlib.pyplot as plt
import numpy as np
pilotos = pd.read_csv('Dados F1/drivers.csv')
qualificacao = pd.read_csv('Dados F1/qualifying.csv')
circuitos = pd.read_csv('Dados F1/circuits.csv')
corridas = pd.read_csv('Dados F1/races.csv')
pole_position = qualificacao.position == 1
poles = qualificacao[pole_position]
poles
circuitos.head()
id_das_corridas_do_bahrein = corridas.query('circuitId == 3')
id_das_corridas_do_bahrein = id_das_corridas_do_bahrein.raceId
id_das_corridas_do_bahrein
Preciso relacionar a coluna "raceId" do DataFrame "Poles" com a Series (ou DataFrame, depende do que for correto) "id_das_corridas_do_bahrein".
Grato desde já!