Desenvolva a classe MyHTMLParser como uma subclasse de HTMLParser que, quando alimentada com um arquivo HTML, mostra os nomes das tags de início e fim na ordem em que aparecem no documento, e com um recuo proporcional à profundidade do elemento na estrutura de árvore do documento. Ignore os elementos HTML que não exigem uma tag de fim, como p e br
O que eu tentei fazer:
from html.parser import HTMLParser
class MyHTMLParser(HTMLParser):
infile = open("w3c.html")
content = infile.read()
infile.close()
myparser = MyHTMLParser()
myparser.feed(content)
def handle_starttag(self, tag, attrs): #mostra valor do atributo href, se houver
for t in tag:
print(t)
Além de o código não fazer nada, ainda recebo:
NameError: name 'MyHTMLParser' is not defined
Poderiam me ajudar?