1
resposta

Completar informação faltando nos dados com outra fonte.

Olá, boa tarde. Eu peguei aqui um arquivo csv com as informações de bilhetagem de impressoras num sistema aqui da minha empresa e minha ideia é trabalhar com ela para organizar essas informações. Entretanto esse arquivo não está completo, nele falta o patrimônio do equipamento(o campo existe, mas está vazio), sendo as únicas referencias aos equipamento o numero de serie e o modelo. Com isso eu foi num banco de dados que eu possuo aqui e exportei dele uma consulta relacionando o numero de série com o patrimônio (são sistemas diferentes e não estão integrados). Quero carregar essas informações de patrimônio e através do numero de serie atualizando assim o dataset que estou usando. Qual é a melhor maneira de fazer isso com o pandas?

1 resposta

Olá Daniel Tudo bem com você??

Vou partir do princípio que você tem acesso aos dois arquivos .csv blz? Agora que a segunda base que mencionou seja possível deixar em .csv igual a primeira.

Você precisa carregar os dois conjuntos de dados normalmente e então mesclar usando:

baseA = pd.read_csv("baseA.csv")
baseB = pd.read_csv("baseB.csv")

base_completa = pd.merge(baseA, baseB)
base_completa.to_csv("base_completa.csv")

ou ainda

base_completa = pd.concat([baseA, baseB], axis = 1)
base_completa = base_completa.drop_duplicates().reset_index(drop=True)

ou pode dropar só as colunas que você tiver interesse com:

base_completa = base_completa.drop(columns="nome_coluna")

Com certeza ainda devem existir mais formas e por isso deixarei o link da documentação do Pandas assim você poderá trabalhar várias possibilidades no seu projeto.

Espero ter te ajudado e qualquer dúvida é só retornar aqui!

Bons estudos!