Qual o motivo do get_text() exibir '\n' e '\t'

Solucionado (ver solução)

Importante

Você está vendo a versão anterior da nova experiência da Alura que estamos preparando para você. Em breve, ela ganha uma identidade visual novinha totalmente pensada em potencializar seus estudos!

Solucionado
(ver solução)

1
resposta

Referente ao curso Scraping com Python: coleta de dados na web, no capítulo Introdução ao BeautifulSoup e atividade Acessando o conteúdo das tags

por Lucas Garcia Santiago de Abreu

| 142.8k xp | 6 posts

input

soup.h5.get_text()

output

'\nAguarde...\r\n\t\t\t\t\t'

o soup está definido como:

url = 'https://alura-site-scraping.herokuapp.com/index.php'
response = urlopen(url)
html = response.read()
soup = BeautifulSoup(html, 'html.parser')

1 resposta

solução!

por João Vitor de Miranda

| 1522k xp | 1891 posts

Instrutor

16/06/2021

Olá Luiz, tudo bem? Espero que sim!

O get_text() extrai a informação de texto de um documento ou tag, incluindo as informações de quebras de linha e tabs. Caso queira remover os caracteres, basta usar um parâmetro strip = True da função get_text:

soup.h5.get_text(strip = True)

Nessa parte da documentação você pode encontrar mais informações.

Bons estudos!

Importante

Trilhas por carreira

Carreiras de IA

Carreiras de Dados

Carreiras de Cyber

Carreiras de DevOps & Cloud

Carreiras de UX & UI

Carreiras de Mobile & Front-End

Carreiras de Back-End

Carreiras de Negócios

Cursos universitários FIAP

Importante

Tópicos relacionados

Conteúdos Alura com o tema

Trilhas por carreira

Carreiras de IA

Carreiras de Dados

Carreiras de Cyber

Carreiras de DevOps & Cloud

Carreiras de UX & UI

Carreiras de Mobile & Front-End

Carreiras de Back-End

Carreiras de Negócios

Cursos universitários FIAP