1
resposta

Problemas com o CHARACTER SET (Mapa de caracteres) em geodataframes

Eu estou trabalhando com um diretório de produtores rurais no Vietnã. Eu já tenho os mapas que com os dados dos polígonos das províncias e dentro dessas províncias, os polígonos e dos nomes dessas localizações. No entanto, quando eu uso o PANDAS para tratar os dados do diretório de endereços o dataframe vem certinho. Quando eu uso o GEOPANDAS para tratar as informações georeferênciais os nomes em vietnamita vêm todos zoados.

Eu vou fazer um join desses df porque no diretório eu não tenho um sistema de coordenadas para cada registro. Eu tenho um endereço e essa unidade de LOCALIZAÇÃO em basta para eu fazer o meu mapa final. Mas eu vou usar como chave de comparação nomes em vietnamita.

Como eu faço para corrigir esse problema de mapa de caracteres no meu dataset do do GEOPANDAS...que será o formato final dos meus dados

O projeto é um choropleth map desses produtores rurais

https://www.dropbox.com/t/n58s1RH0KXUuHRTx
1 resposta

Oiii Luiz, como você está? Espero que esteja bem ^-^

Peço perdão pela demora em obter um retorno.

O link que você disponibilizou para acesso dos dados não está disponível.

Por padrão, ao utilizar o read_file, o geopandas tentará detectar a codificação dos dados de forma automática, mas nem sempre ele conseguirá definir o tipo de codificação, como aconteceu no seu caso. E para isso, para tratar os caracteres dos dados, você pode utilizar o parâmetro enconding e passar qual a codificação correspondente, por exemplo: uft-8, latin1, ascii.

df = geopandas.read_file("arquivo.shp", encoding='utf-8') 

Se o arquivo estiver em utf-8, deverá passar o parâmetro 'utf-8', se estiver em latin1, deverá passar 'latin1', e assim por diante.

Neste link de listas de codificações é possível verificar todas as possibilidades de encoding e respectivas linguagens/idiomas para cada tipo.

Qualquer dúvida fico à disposição.

Abraços e bons estudos!