Na importação via URL como o Pandas identifica o que é uma tabela e o que não é? Ele usa uma outra biblioteca para fazer essa escolha ou o próprio Pandas identifica as tags no HTML?
Na importação via URL como o Pandas identifica o que é uma tabela e o que não é? Ele usa uma outra biblioteca para fazer essa escolha ou o próprio Pandas identifica as tags no HTML?
Olá Gabriel.
O próprio Pandas reconhece as tags HTML e a partir dai começa a fazer a leitura e busca pelas tags de table, tr e td.
Você pode encontrar mais detalhes do funcionamento na documentação do Pandas, por exemplo o funcionamento do read_html, recomendo também a leitura da parte de entradas e saídas de dados do Pandas, o IO tools, e por fim se tiver realmente interesse de saber com o Pandas implementa essa função você pode se aventurar no código que está disponível no git hub.
Todo esse material está inglês, mas utilizando o Traduzir Pagina do Google, já conseguimos entender bem o que é dito. Mas também traga as suas duvidas que surgirem que vamos te ajudar.
Bons Estudos.