1
resposta

[Dúvida] Não consigo detectar o encoding com url

Olá,

Tentei dectar o encoding do arquivo por conta própria usando o passo a passo da sessão "Para saber mais: erro de encoding - Como resolver?", mas não obtive êxito.

Segue o que elaborei:

url = 'https://raw.githubusercontent.com/alura-cursos/Pandas/main/dados_sus.csv'

with open(url, 'rb') as file:
    print(chardet.detect(file.read()))

Com isso apareceu a seguinte mensagem:

---------------------------------------------------------------------------
FileNotFoundError                         Traceback (most recent call last)
<ipython-input-5-a322cb2c3fce> in <cell line: 1>()
----> 1 with open(url, 'rb') as file:
      2     print(chardet.detect(file.read()))

FileNotFoundError: [Errno 2] No such file or directory: 'https://raw.githubusercontent.com/alura-cursos/Pandas/main/dados_sus.csv'

Minha dúvida é: eu consigo utilizar o 'chardet' com uma url? ou é preciso baixar o arquivo e utilizar o diretório salvo no meu notebook?

1 resposta

Oi, Yuri! tudo bem?

Para utilizar a chardet a partir de uma url, você pode fazer assim:

import urllib.request
dados = urllib.request.urlopen('https://raw.githubusercontent.com/alura-cursos/Pandas/main/dados_sus.csv').read()
import chardet
chardet.detect(dados)

O código utiliza o módulo urllib.request para abrir uma URL. Em seguida, ele lê os dados desse arquivo usando a função read() e os armazena na variável dados. Posteriormente, o módulo chardet é empregado para analisar esses dados e determinar a codificação de texto mais provável.

Qualquer dúvida não hesite em perguntar :) Bons estudos pra você