1
resposta

Erro ao ler arquivo html com pandas

O executar o código abaixo está apresentando o seguinte erro:

df_html = pd.read_html('dados/dados_html_1.html')
df_html
ImportError                               Traceback (most recent call last)
<ipython-input-32-8c3ab867f71b> in <module>
----> 1 df_html = pd.read_html('dados/dados_html_1.html')
      2 df_html

~\Anaconda3\envs\alura_pandas_2\lib\site-packages\pandas\io\html.py in read_html(io, match, flavor, header, index_col, skiprows, attrs, parse_dates, tupleize_cols, thousands, encoding, decimal, converters, na_values, keep_default_na)
    913                   thousands=thousands, attrs=attrs, encoding=encoding,
    914                   decimal=decimal, converters=converters, na_values=na_values,
--> 915                   keep_default_na=keep_default_na)

~\Anaconda3\envs\alura_pandas_2\lib\site-packages\pandas\io\html.py in _parse(flavor, io, match, attrs, encoding, **kwargs)
    737     retained = None
    738     for flav in flavor:
--> 739         parser = _parser_dispatch(flav)
    740         p = parser(io, compiled_match, attrs, encoding)
    741 

~\Anaconda3\envs\alura_pandas_2\lib\site-packages\pandas\io\html.py in _parser_dispatch(flavor)
    695     else:
    696         if not _HAS_LXML:
--> 697             raise ImportError("lxml not found, please install it")
    698     return _valid_parsers[flavor]
    699 

ImportError: lxml not found, please install it
1 resposta

Olá Elton, boa noite!

Quando um erro ocorre no python, sempre procure a mensagem mostrada na última linha. No seu caso é: ImportError: lxml not found, please install it

Ou seja, o python não consegue importar o módulo lxml. Você precisa instalar. Você pode fazer isso diretamente no anaconda ou utilizar o comando abaixo dentro do seu ambiente virtual:

pip3 install lxml

Espero ter ajudado e bons estudos!