2
respostas

Não consigo treinar o modelo.

Não consigo treinar o modelo. já tentei dicas e a mensagem é a mesma. Já testei em outras regiões e nada. abaixo o erro:

The DAG failed because some tasks failed. The failed tasks are: [exit-handler-1].; Job (project_id = empresa-alimentos-445217, job_id = 4180019952385785856) is failed due to the above error.; Failed to handle the job: {project_number = 326941140251, job_id = 4180019952385785856}

Obrigado!

2 respostas

Oi, Claudio! Como vai?

O erro indica um problema na execução do seu job no Vertex AI, especificamente na tarefa exit-handler-1, o que pode estar relacionado a:

  1. Recursos insuficientes: Verifique se alocou memória, CPU e máquinas virtuais adequadas para o treinamento. Talvez seja necessário ajustar a memória RAM, o número de CPUs virtuais ou o tipo de máquina virtual usada.
  2. Problemas com os dados: Revise seu conjunto de dados, garantindo que ele não tenha erros ou inconsistências.
  3. Configurações: Confirme se os parâmetros, como região, modelo e saída, estão corretos.
  4. Permissões: Assegure-se de que sua conta possui permissões para executar o job.

Tente criar um job de treinamento com um conjunto de dados muito pequeno (apenas algumas linhas). Se funcionar, o problema pode estar no conjunto de dados original. Se falhar, revise as configurações e permissões.

Espero ter ajudado. Conte com o apoio do Fórum na sua jornada. Fico à disposição.

Abraços e bons estudos!

Caso este post tenha lhe ajudado, por favor, marcar como solucionado ✓. Bons Estudos!

Oi, obrigado pela resposta. Vou reavaliar as configurações.

[]'s