Solucionado (ver solução)
Solucionado
(ver solução)
1
resposta

[Dúvida] Dúvida sobre questão da aula 4

Não entendi como faço para conseguir o endereço da página das populações médias, já que não funciona com o seguinte código

pd.read_html('https://pt.wikipedia.org/wiki/Lista_de_países_por_população')[0]

Edit: Vi que na resposta do exercício foi utilizado o seguinte código

pd.read_html('https://pt.wikipedia.org/wiki/Lista_de_pa%C3%ADses_por_popula%C3%A7%C3%A3o')[0]

Mas como eu saberia como substituir as letras com acento por esses caracteres?

1 resposta
solução!

Olá Davi, tudo bem com você?

Ótima pergunta. A diferença entre os dois códigos que você apresentou está na forma como o URL está codificado. No primeiro, tentamos acessar a página usando caracteres comuns, como acentos. No entanto, URLs não costumam lidar bem com caracteres especiais e acentos, então eles precisam ser codificados de uma maneira especial para serem interpretados corretamente.

No segundo código, a URL está codificado em uma forma conhecida como percent-encoding, que é um padrão para codificar informações que serão incluídas em um URL, onde os caracteres acentuados são substituídos por uma sequência de caracteres que começa com um sinal de porcentagem (%), seguido por dois dígitos hexadecimais que representam o valor do caractere original.

Para saber como substituir as letras com acentos por esses caracteres, você pode utilizar o site url-encode-decode, que converte automaticamente a URL com caracteres especiais para o formato percent-encoding como mostro no gif a seguir:

GIF exibindo o uso do site url-encode-decode para a conversão dos caracteres especiais para o formato percent-encoding

Espero ter ajudado. Continue mergulhando em conhecimento e não hesite em voltar ao fórum para continuar aprendendo e interagindo com a comunidade. Em caso de dúvidas estou à disposição.

Abraços e bons estudos!

Caso este post tenha lhe ajudado, por favor, marcar como solucionado ✓. Bons Estudos!