Quando o HTML tiver mais de um tabela, por exemplo, vamos supor que tenha a tabela1, tabela2 e tabela3 como faço para obter somente a tabela2
Agradeço o apoio.
Quando o HTML tiver mais de um tabela, por exemplo, vamos supor que tenha a tabela1, tabela2 e tabela3 como faço para obter somente a tabela2
Agradeço o apoio.
Olá Fernando, tudo bem? Espero que sim!
Ao utilizar a função pd.read_html(), é gerada uma lista com todas as tabelas do código HTML, e podemos acessar as tabelas de forma isolada utilizando a referência do índice nessa lista.
Suponha que seja armazenenado as tabelas de um HTML em uma variável dados, como no código a seguir:
dados = pd.read_html(url)
Podemos acessar a primeira tabela através de dados[0], a segunda tabela através de dados[1] e assim por diante. Vale lembrar que o índice de uma lista em Python começa em 0, portanto caso queiramos acessar somente a tabela 2, precisamos utilizar dados[1].
Portanto você pode armazenar em uma nova variável ou ainda substituir a variável original pela tabela do seu desejo, caso não necessite das outras tabelas posteriormente.
Pode ser usado um dos códigos a seguir, dependendo da sua escolha:
dados = pd.read_html(url)
tabela2 = dados[1]
ou
dados = pd.read_html(url)
dados = dados[1]
Espero que tenha tirado sua dúvida.
Estou à disposição. Bons estudos!