Solucionado (ver solução)
Solucionado
(ver solução)
1
resposta

Qual o motivo do get_text() exibir '\n' e '\t'

input

soup.h5.get_text()

output

'\nAguarde...\r\n\t\t\t\t\t'

o soup está definido como:

url = 'https://alura-site-scraping.herokuapp.com/index.php'
response = urlopen(url)
html = response.read()
soup = BeautifulSoup(html, 'html.parser')
1 resposta
solução!

Olá Luiz, tudo bem? Espero que sim!

O get_text() extrai a informação de texto de um documento ou tag, incluindo as informações de quebras de linha e tabs. Caso queira remover os caracteres, basta usar um parâmetro strip = True da função get_text:

soup.h5.get_text(strip = True)

Nessa parte da documentação você pode encontrar mais informações.

Bons estudos!