Pessoal, seguinte... minha esposa recebe mensalmente planilhas de 4 ou 5 fornecedores diferentes... cada uma com cerca de 1000 registros... Essa planilhas não tem o mesmo layout e por isso quero criar uma rotina para o tratamento desses dados.
Eu consigo carregar elas para Jupiter. Chamo todas para dataframes independentes, indexo o registros, agrupo o que me interessa..ok... mas tem uma parte que eu não sei por onde começar
Cada registros desse vem com um código de produto do fornecedores. Na empresa na minha esposa eles tem o código deles e fazem a precificação para revenda de cada produto.
Eu preciso tratar uma coluna que traz esse código puxando somente os 6 primeiros algarismos desse código. Os demais algarismos não me interessam. (No Excel é tranquilo fazer isso, mas no pandas eu não achei como) (1) Como eu faço esse tratamento de dados?
(2) Quando eu padronizar essa coluna de códigos, eu vou comparar essa coluna com a coluna de tabela de preço dela.
Se o código existir na tabela de preço e na tabela dos dados tratados, eu preciso das informações no row desse registro nesse novo dataset
Alguma sugestão para construção desse código?
E finalmente exportar essa tabela de preço, checada com os códigos e as informações pertinentes — isso eu dou conta tranquilo!
Agradeço sugestão dos paths para essas tarefas...