input
soup.h5.get_text()
output
'\nAguarde...\r\n\t\t\t\t\t'
o soup está definido como:
url = 'https://alura-site-scraping.herokuapp.com/index.php'
response = urlopen(url)
html = response.read()
soup = BeautifulSoup(html, 'html.parser')
input
soup.h5.get_text()
output
'\nAguarde...\r\n\t\t\t\t\t'
o soup está definido como:
url = 'https://alura-site-scraping.herokuapp.com/index.php'
response = urlopen(url)
html = response.read()
soup = BeautifulSoup(html, 'html.parser')
Olá Luiz, tudo bem? Espero que sim!
O get_text() extrai a informação de texto de um documento ou tag, incluindo as informações de quebras de linha e tabs. Caso queira remover os caracteres, basta usar um parâmetro strip = True
da função get_text:
soup.h5.get_text(strip = True)
Nessa parte da documentação você pode encontrar mais informações.
Bons estudos!