3
respostas

instalação da biblioteca Dataprofile com falha

A biblioteca data profiler instala com alguns erros e quando vou executar a função dá erro. Estou usando o próprio google colab e o notebook da aula.

Os erros na instalação são:
ERROR: pip's dependency resolver does not currently take into account all the packages that are installed. This behaviour is the source of the following dependency conflicts.
shap 0.50.0 requires numpy>=2, but you have numpy 1.26.4 which is incompatible.
tensorstore 0.1.81 requires ml_dtypes>=0.5.0, but you have ml-dtypes 0.4.1 which is incompatible.
grpcio-status 1.71.2 requires protobuf<6.0dev,>=5.26.1, but you have protobuf 4.25.8 which is incompatible.
opentelemetry-proto 1.38.0 requires protobuf<7.0,>=5.0, but you have protobuf 4.25.8 which is incompatible.
xarray-einstats 0.10.0 requires numpy>=2.0, but you have numpy 1.26.4 which is incompatible.
opencv-contrib-python 4.13.0.92 requires numpy>=2; python_version >= "3.9", but you have numpy 1.26.4 which is incompatible.
tobler 0.13.0 requires numpy>=2.0, but you have numpy 1.26.4 which is incompatible.
tf-keras 2.19.0 requires tensorflow<2.20,>=2.19, but you have tensorflow 2.17.1 which is incompatible.
jaxlib 0.7.2 requires ml_dtypes>=0.5.0, but you have ml-dtypes 0.4.1 which is incompatible.
jaxlib 0.7.2 requires numpy>=2.0, but you have numpy 1.26.4 which is incompatible.
keras-hub 0.21.1 requires keras>=3.5, but you have keras 3.4.0 which is incompatible.
ydf 0.15.0 requires protobuf<7.0.0,>=5.29.1, but you have protobuf 4.25.8 which is incompatible.
tensorflow-text 2.19.0 requires tensorflow<2.20,>=2.19.0, but you have tensorflow 2.17.1 which is incompatible.
rasterio 1.5.0 requires numpy>=2, but you have numpy 1.26.4 which is incompatible.
opencv-python 4.13.0.92 requires numpy>=2; python_version >= "3.9", but you have numpy 1.26.4 which is incompatible.
pytensor 2.38.0 requires numpy>=2.0, but you have numpy 1.26.4 which is incompatible.
grain 0.2.16 requires protobuf>=5.28.3, but you have protobuf 4.25.8 which is incompatible.
tensorflow-decision-forests 1.12.0 requires tensorflow==2.19.0, but you have tensorflow 2.17.1 which is incompatible.
jax 0.7.2 requires ml_dtypes>=0.5.0, but you have ml-dtypes 0.4.1 which is incompatible.
jax 0.7.2 requires numpy>=2.0, but you have numpy 1.26.4 which is incompatible.
opencv-python-headless 4.13.0.92 requires numpy>=2; python_version >= "3.9", but you have numpy 1.26.4 which is incompatible

3 respostas

Olá, Gustavo! Tudo bem?

Não se preocupe, essa mensagem de erro é comum e não impedirá o andamento do seu projeto.

O que aconteceu foi um conflito de versões: o DataProfiler[ml] exige versões específicas (e um pouco mais antigas) de bibliotecas como o NumPy e o TensorFlow para funcionar corretamente. Ao instalá-lo, o Google Colab precisou fazer um "downgrade" (instalar uma versão anterior) desses pacotes, o que gerou o alerta de conflito com outras bibliotecas já presentes no ambiente (como jax e opencv).

Como o próprio aviso sugere, a solução é reiniciar a sessão para que o Python carregue as versões corretas que acabaram de ser instaladas.

Para resolver isso, siga estes passos:

  1. No menu superior do Google Colab, clique em Ambiente de execução;
  2. Selecione a opção Reiniciar sessão e executar tudo.

Você pode se guiar pela imagem abaixo:

Reiniciar sessão e executar tudo, no Google Colaboratory

Após isso, o código deverá rodar perfeitamente. Se precisar de mais alguma ajuda, é só avisar!

Abraços e bons estudos!

Caso este post tenha lhe ajudado, por favor, marcar como solucionado ✓. Bons Estudos!

Olá Monalisa, tudo bem?

De fato não é um impeditivo, eu terminei o módulo, mas fiz o que recomendou e continuou dando erro:

ValueError Traceback (most recent call last)
/usr/local/lib/python3.12/dist-packages/dataprofiler/profilers/profile_builder.py in init(self, data, samples_per_update, min_true_samples, options)
748
--> 749 data_labeler = DataLabeler(
750 labeler_type=self._default_labeler_type,

25 frames
ValueError: JAX requires ml_dtypes version 0.5 or newer; installed version is 0.4.1.

During handling of the above exception, another exception occurred:

ValueError Traceback (most recent call last)
/usr/local/lib/python3.12/dist-packages/dataprofiler/profilers/profiler_utils.py in warn_on_profile(col_profile, e)
158 # This is considered a major error
159 if type(e).name == "ValueError":
--> 160 raise ValueError(e)
161 warning_msg += "\n\nFor labeler errors, try installing "
162 warning_msg += "the extra ml requirements via:\n\n"

ValueError: JAX requires ml_dtypes version 0.5 or newer; installed version is 0.4.1.

Oi, Gustavo!

Quando o ambiente do Colab é desconectado e você precisa executá-lo novamente, ao rodar o comando !pip install DataProfiler[ml], esse erro sempre vai aparecer devido a incompatibilidades com bibliotecas que já vêm pré-instaladas no Colab.

Nesse caso, a solução mais adequada é a sugerida pelo próprio ambiente Colab: reiniciar a sessão após a instalação. Isso garante que as novas versões das bibliotecas sejam corretamente carregadas com as versões compatíveis.

Outra alternativa é forçar versões específicas das dependências para evitar conflitos. Por exemplo:

Trocar:

!pip install DataProfiler[ml]

Por:

!pip install "numpy<2" "tensorflow<2.18" DataProfiler[ml]

Essa abordagem pode ajudar no ínico, mas vale lembrar que forçar versões pode impactar outras bibliotecas do ambiente ao decorrer do projeto. Portanto, o mais recomendado é fazer exatamente o que o Colab sugere reiniciar o ambiente.


Já esse segundo erro, ValueError: JAX requires ml_dtypes version 0.5 or newer; installed version is 0.4.1., acredito que você obteve ao executar profile = Profiler(dados), correto?

Neste caso, a sugestão é que você siga o passo da nota na transcrição da aula. Deixo também um tópico para ajudar:

Abaixo deixo um link do meu notebook:

Peço que faça o teste e veja se o problema é solucionado.

Qualquer dúvida, fico à disposição!

Caso este post tenha lhe ajudado, por favor, marcar como solucionado ✓. Bons Estudos!